Arsitektur Data Modern
APAKAH ANDA MEMBUTUHKAN GUDANG DATA SAAT ANDA MEMILIKI DATA BESAR?
Tapi apakah kesan itu benar? Benarkah dengan Big Data Anda tidak memerlukan data warehouse? Makalah ini akan membahas masalah ini. Pertama, apa itu gudang data? Sejak awal, definisi yang diterima dari data warehouse adalah kumpulan
dari data yaitu:
1 berorientasi subjek
2 Terpadu
3 varian waktu
4 Tidak mudah menguap
Definisi data warehouse ini banyak dikutip sebagai definisi dari apa itu data warehouse. (Lihat MEMBANGUN GUDANG DATA, John Wiley, yang aslinya diterbitkan tahun 1991.)
Definisi Big Data tidak begitu jelas. Memang ada interpretasi yang berbeda mengenai apa yang dimaksud dengan “Big Data”. Tapi untuk keperluan tulisan ini definisi Big Data berikut akan digunakan.
Data besar:
1 Meliputi volume data yang sangat besar
2 disimpan pada penyimpanan yang terjangkau
3 disimpan secara tidak terstruktur
4 dikelola dengan menggunakan teknik “sensus Romawi”.
Arsitektur
Data warehouse adalah arsitektur. Gudang data membutuhkan disiplin untuk membangun dan menyimpan.
Sebuah gudang data bisa disimpan di berbagai media. Inti dari data warehouse adalah integritas data. Cara lain untuk memikirkan sebuah gudang data adalah bahwa sebuah gudang data adalah satu versi kebenaran.
Data yang masuk ke gudang data dibuat dengan hati-hati dan diperiksa. Data yang ditemukan di data warehouse adalah data yang digunakan untuk keputusan paling dasar yang dibuat oleh perusahaan. Secara tradisional data yang memasuki data warehouse terintegrasi dengan menggunakan teknologi yang disebut “ETL” (ekstrak / transform / load). Data biasanya dimulai dalam sebuah aplikasi dan direkonstruksi menjadi format korporat tunggal yang terintegrasi saat ditempatkan di dalam gudang data. Inti dari data warehouse adalah arsitektur integritas data.
Teknologi
Big Data adalah sebuah teknologi. Big Data mampu menyimpan sejumlah besar data. Big Data adalah media fisik.
Di Big Data, ada mekanisme penyimpanan yang menyebabkan data ditulis dan kemudian dicari saat diinginkan. Ada perbedaan mendasar antara teknologi dan arsitektur. Secara analog, arsitektur seperti waktu dan teknologi seperti jam yang menjaga waktu. Sementara waktu hari pasti terkait dengan jam yang menjaga waktu, namun ada perbedaan mendasar antara arsitektur dan teknologi. Fakta bahwa pada pukul 14:36 di Orange County, California sangat berbeda dengan fakta bahwa waktu disimpan di Rolex atau jam tangan Seiko. Rolex di Orange County dapat menunjukkan jam 4:13 malam saat jam 2:36 siang. Hanya karena Rolex adalah arloji yang bagus tidak berarti ia memiliki waktu yang tepat. Dan masih 2:36 pm di Orange County terlepas dari apakah arloji setuju atau tidak. Jadi terlihat bahwa ada perbedaan antara waktu aktual dan jam yang menjaga waktu. Waktu hari adalah waktu tanpa mempedulikan apa yang dikatakan Rolex, dan satu Rolex mungkin akan menunjukkannya satu kali dan Rolex lain mungkin punya waktu lain.
Ada perbedaan yang sama antara arsitektur dan teknologi. Anda bisa meletakkan data warehouse di Big Data atau pada teknologi penyimpanan standar. Ini masih merupakan gudang data dimana pun berada. Atau Anda bisa memasukkan data yang bukan data warehouse di Big Data atau pada teknologi storage.
Tidak ada persaingan antara Big Data dan data warehouse. Mereka adalah hal yang sama sekali berbeda.
Sumber : W.H. Inmon