Arsitektur Data Modern 4
DATA ARCHIVAL TERHADAP DATA BESAR
Ada lagi arus data yang terjadi antara data warehouse dan Big Data. Aliran itu terjadi saat saatnya mengarsipkan data dari gudang data. Data Besar – data berulang – digunakan untuk menampung arsip data yang ditemukan di gudang data yang telah berusia.
MELAKUKAN ANALYTICS
Analytics dapat dilakukan di seluruh lanskap. Pengolahan analisis klasik terhadap data berbasis transaksi dilakukan di gudang data seperti yang pernah dilakukan. Tidak ada yang berubah di sana. Tapi sekarang analisis tentang data kontekstual dapat dilakukan, dan bentuk analisis itu baru dan baru.
Sebagian besar organisasi belum dapat mendasarkan pengambilan keputusan pada data tekstual tidak terstruktur sebelumnya. Dan ada bentuk analisis baru yang mungkin dilakukan di gudang data, yang merupakan kemungkinan analisis campuran. Analisis campuran adalah analisis yang dilakukan dengan menggunakan gabungan data transkripsional terstruktur dan data kontekstual yang tidak terstruktur.
Tapi ada banyak bentuk analisis lain yang mungkin juga. Ada kemungkinan melakukan analisis di dalam lingkungan data Big Data yang berulang. Di sinilah pengolahan analitis NoSQL adalah sebuah kemungkinan. Dan bentuk analisis lainnya adalah analisis dari Big Data yang diperkaya konteks. Bagian tertentu dari lingkungan Data Besar adalah data yang diperkaya konteks yang dapat menghasilkan hasil analisisnya sendiri juga.
Masing-masing bentuk pengolahan analitis yang berbeda ini menghasilkan hasil unik tersendiri.
DATA MARTS DAN MODEL DIMENSI
Salah satu pertanyaan menarik dalam arsitektur data yang telah disajikan adalah apa yang telah terjadi pada data mart? Data mart masih merupakan bagian dari lansekap arsitektural. Pengguna akhir masih memerlukan penyajian individual masing-masing terhadap data mereka sendiri. Masih ada kebutuhan akan teknologi dimensi. Data mart masih diberi makan dan dipicu
oleh data mentah yang berada di gudang data.
APA TENTANG PEMODELAN?
Dasar perancangan untuk data warehouse tetap menjadi model data dan struktur relasional. Dasar perancangan lingkungan data mart masih merupakan model dimensional. Dasar pemahaman data non-repetitif adalah taksonomi dan ontologi. Dan dasar perancangan dan pengelolaan data berulang adalah
skema untuk kejadian rekaman berulang.
Yang menarik, model data, model dimensi, taksonomi dan ontologi semuanya sangat terkait namun tetap berbeda. Mereka seperti saudara kembar terkait darah dalam keluarga. Jika Anda melihat sekelompok saudara kandung, Anda melihat bahwa mereka semua adalah anak laki-laki atau perempuan, semuanya memiliki warna kulit yang serupa, Anda tahu bahwa mereka memiliki hidung dan mulut yang serupa.
dan mata. Dan pada saat bersamaan ada perbedaan individu yang dimiliki masing-masing saudaranya. Mereka semua jelas dari keluarga yang sama dan pada saat bersamaan mereka semua masih individu yang unik.
Sumber : W.H. Inmon