People Innovation Excellence
 

Arsitektur Data Modern 2

DUA JENIS DATA DI GUDANG DATA

Perhatikan bahwa jika data kontekstual dikirim ke gudang data, disimpan di tempat khusus di gudang data.

Basis data akhirnya memiliki dua jenis data di dalamnya – data yang sumbernya adalah data terstruktur berbasis transaksi tradisional, dan data yang sumber data tidak terstruktur. Meskipun gudang data ditempatkan dalam struktur relasional klasik, sumber data di gudang data berbeda secara drastis. Oleh karena itu, data warehouse klasik akhirnya memiliki dua jenis data yang berbeda – data berbasis transaksi, terstruktur dan data yang tidak terstruktur dan kontekstual.

Salah satu hal yang sangat bagus tentang dua jenis data di gudang data adalah karena semua data masuk dalam format relasi terstruktur, data dapat dicampur dan dicocokkan secara bebas, dan digabungkan dan dianalisis melintasi berbagai jenis data dapat dilakukan. .

JENIS BARU PENGOLAHAN ANALYTICAL

Kemampuan untuk menggabungkan berbagai jenis data menghasilkan pemrosesan analitis yang sampai sekarang tidak dapat dilakukan. Data relasi terstruktur sebelumnya tidak dapat dicampur secara analitis dan disesuaikan dengan data tekstual yang tidak terstruktur. Tetapi dengan munculnya kontekstualisasi, jenis analisis ini dapat dilakukan dan alami dan mudah dilakukan.

REPETITIF DATA / DATA INTERFACE WAREHOUSE

Ada tipe data lain yang ditemukan di lingkungan Big Data dan data adalah jenis data berulang. Data berulang tidak perlu dilewatkan melalui teknik disambiguasi tekstual karena data berulang tidak berdasarkan tekstual. Tapi data berulang bisa ditempatkan di gudang data jika diinginkan. Ada dua cara dasar agar data berulang dilewatkan ke gudang data. Salah satunya adalah melalui penyaringan. Dalam penyaringan, data berulang dibaca dan kemudian setelah data telah dipilih, data dikirim ke gudang data. Sebagai contoh, analis mungkin ingin menemukan semua catatan detail panggilan telepon untuk St Louis, MO untuk 22 September 2015 dan mencatatnya ke gudang data. Begitu catatan disimpan di gudang data, mereka akan diperiksa dan diperiksa lebih lanjut.

Penyaringannya kemudian hanya berupa pembacaan dan seleksi rekaman yang kemudian dikirim ke gudang data.

Jenis pengolahan kedua adalah distilasi. Distilasi mirip dengan penyaringan kecuali penyulingan mengharuskan pemrosesan lebih lanjut dilakukan sebelum catatan dikirim ke gudang data. Contoh sederhana penyulingan mungkin adalah penghitungan catatan yang telah dipilih. Misalnya, proses penyulingan hanya bisa menghitung jumlah penjualan barang lebih besar dari $ 10.00 untuk setiap toko Wal-Mart pada bulan September 2015.

Hasil distilasi dan penyaringan Big Data ditempatkan di gudang data. Biasanya hasilnya ditempatkan di bagian terpisah dari data warehouse karena basis data yang ditemukan di data warehouse tidak terstruktur, data berbasis transaksi.

Perlu dicatat bahwa proses penyaringan dan distilasi data berulang bisa menjadi sangat terlibat. Biasanya komplikasi datang dalam bentuk penanganan volume data yang dibutuhkan untuk analisis. Dalam beberapa kasus, ada sejumlah besar data yang harus diolah. Dalam kasus lain, karakteristik data yang dicari tidak didefinisikan secara jelas dan tidak jelas.

Sumber : W.H. Inmon


Published at : Updated
Written By
Sulistyo Heripracoyo
Subject Content Coordinator | School of Information Systems http://sis.binus.ac.id/
Leave Your Footprint

    Periksa Browser Anda

    Check Your Browser

    Situs ini tidak lagi mendukung penggunaan browser dengan teknologi tertinggal.

    Apabila Anda melihat pesan ini, berarti Anda masih menggunakan browser Internet Explorer seri 8 / 7 / 6 / ...

    Sebagai informasi, browser yang anda gunakan ini tidaklah aman dan tidak dapat menampilkan teknologi CSS terakhir yang dapat membuat sebuah situs tampil lebih baik. Bahkan Microsoft sebagai pembuatnya, telah merekomendasikan agar menggunakan browser yang lebih modern.

    Untuk tampilan yang lebih baik, gunakan salah satu browser berikut. Download dan Install, seluruhnya gratis untuk digunakan.

    We're Moving Forward.

    This Site Is No Longer Supporting Out-of Date Browser.

    If you are viewing this message, it means that you are currently using Internet Explorer 8 / 7 / 6 / below to access this site. FYI, it is unsafe and unable to render the latest CSS improvements. Even Microsoft, its creator, wants you to install more modern browser.

    Best viewed with one of these browser instead. It is totally free.

    1. Google Chrome
    2. Mozilla Firefox
    3. Opera
    4. Internet Explorer 9
    Close