Granularity Pada Data Warehouse
Granularity adalah tingkat kedetailan data dalam suatu data warehouse. Semakin detail data, maka tingkat granularity-nya akan semakin rendah juga. Jadi Level Low / yang paling terendah adalah ketika tingkat kedetailan yang tinggi,misalnya pada data transaksi.
Titik awal untuk menentukan tingkat yang tepat dari granularity adalah dengan melakukan perkiraan baku jumlah baris data dan DASD (direct access storage device) atau akses langsung perangkat penyimpanan yang akan di masukkan dalam data warehouse.
Jalur algoritma untuk menghitung ruang yang ditempati oleh data warehouse adalah :
– Identifikasi semua tabel yang akan dibangun
– Perkirakan ukuran baris di setiap tabel
– Pada cakrawala satu tahun, memperkirakan jumlah maksimum dan minimum baris dalam tabel
– Hitung proyeksi ruang data indeks
- Data Overflow
Setelah perkiraan baku untuk ukuran data warehouse dibuat, langkah selanjutnya adalah membandingkan jumlah baris dalam lingkungan gudang ke grafik.
Teorinya adalah bahwa setelah lima tahun, faktor-faktor ini akan di tempat:
– Akan ada lebih banyak keahlian yang tersedia dalam mengelola volume data pada data warehouse.
– Biaya Hardware (perangkat keras) akan turun sampai batas tertentu.
– Software (perangkat lunak) yang lebih kuat akan tersedia.
– End user atau pengguna akhir akan lebih canggih.
- Tingkat Granularity
Setelah analisis sederhana berapa banyak data yang akan ada di gudang data dilakukan (dan, sebenarnya, banyak perusahaan menemukan bahwa mereka perlu menempatkan setidaknya beberapa data ke dalam penyimpanan overflow), langkah berikutnya adalah untuk menentukan tingkat granularity untuk data yang berada pada disk penyimpanan.
Satu-satunya cara nyata untuk menentukan tingkat yang tepat dari granularity untuk data ringan diringkas adalah untuk menempatkan data di depan end user atau pengguna akhir. Pertimbangan kedua dalam menentukan tingkat granularity untuk mengantisipasi kebutuhan entitas arsitektur yang berbeda yang akan di isi berdasarkan dari data warehouse.
- Feedback loop techniques (teknik umpan balik)
Berikut ini adalah teknik untuk membuat feedback loop techniques atau teknik umpan balik yang harmonis:
– Membangun bagian pertama dari data warehouse di sangat kecil, langkah sangat cepat, dan hati-hati mendengarkan komentar pengguna akhir pada akhir setiap langkah pembangunan.
– Jika tersedia, gunakan prototyping dan memungkinkan umpan balik untuk fungsi menggunakan pengamatan yang dikumpulkan dari prototipe.
– Lihatlah bagaimana orang lain telah membangun tingkat granularity mereka dan belajar dari pengalaman mereka.
– Pergi melalui proses umpan balik dengan pengguna berpengalaman yang menyadari proses yang terjadi.
– Lihatlah apa saja organisasi yang kini muncul dan terlihat berjalan, dan menggunakan persyaratan fungsional tersebut sebagai panduan.
– Jalankan sesi Joint Application Design (JAD) atau aplikasi desain bersama dan mensimulasikan output untuk mencapai umpan balik yang diinginkan.
- Tabel fakta Granularity
Langkah pertama dalam merancang sebuah tabel fakta adalah untuk menentukan granularity dari tabel fakta. Dengan granularitas, berarti tingkat terendah informasi yang akan disimpan dalam tabel fakta. Ini merupakan dua langkah:
- Tentukan dimensi mana yang akan dimasukkan
- Tentukan sepanjang apa hirarki masing-masing dimensi informasi akan disimpan.
Faktor-faktor yang menentukan biasanya kembali kepada persyaratannya.