School of Information Systems

Analytical Information System

Big Data dan Data Warehouse dalam mendukung melakukan Data Mining

  • Latar Belakang

Masih ada istilah dalam manajemen database bahwa organisasi kaya akan data, baik organisasi bisnis maupun non profit, tetapi perusahaan telah kaya akan data tetapi rendah informasi. Sebuah gudang data lebih dari sekedar file atau fasilitas penyimpanan data; ia harus dirancang untuk menyediakan cakupan dan data penting untuk memfasilitasi penyelesaian kasus yang berhasil. Gudang data dibuat sebagai tanggapan atas kebutuhan Manajemen & Analisis Informasi yang tidak terpenuhi oleh database yang ada.

  • Data Mining

Penambangan data digunakan untuk mengidentifikasi tren signifikan dalam statistik yang sulit ditemukan secara eksplisit karena banyaknya statistik yang tersedia dan banyak variabel yang dapat memengaruhi pola-pola ini. Tujuan dari data mining adalah menemukan pola yang dapat digunakan untuk membangun sesuatu yang berguna bagi bisnis. Pertimbangkan berapa banyak statistik yang ada di sebuah perusahaan; jika tidak digunakan, mereka hanya akan menjadi tumpukan data yang tidak berguna.

Data Mining menganalisis sekumpulan statistik yang sudah mapan, tetapi tidak sama dengan analisis statistik karena Data Mining tidak melibatkan pembuatan hipotesis seperti halnya analisis statistik. Alat Data Mining dapat digunakan lebih dari sekedar statistik numerik.

Ada 6 operasi yang biasanya digunakan dalam Data Mining yaitu:

  1. Asosiasi yang digunakan untuk mengenali perilaku yang ada pada kejadian khusus yang terjadi.
  2. Klasifikasi yang digunakan untuk mengenali perilaku atribut dari kelompok yang telah dibuat.
  3. Regresi atau sering disebtu forecasting digunakan untuk memperkirakan nilai di masa mendatang berdasarkan data yang ada sebelumnya.
  4. Time series atau disebut juga dengan forecasting digunakan sama dengan regresi namun perkiraan data hanya bergantung pada waktu.
  5. Cluster digunakan untuk melakukan pengelompokan seperti klasifikasi dengan menggunakan neural network atau statistik.
  6. Sequence digunakan mirip dengan asosiasi namun kejadian-kejadian yang terjadi akan dihubungkan.
  • Data Warehouse

Gudang data adalah database yang dirancang khusus untuk menjalankan kueri, membuat laporan, dan menganalisis data. Data yang dikumpulkan adalah catatan perusahaan komersial dari organisasi atau bisnis tertentu, yang tidak dikumpulkan secara rinci / detil.

Karena setiap gudang catatan memiliki catatan dengan persyaratan berbeda, sistem ETL yang memenuhi persyaratan merupakan solusi yang lebih baik untuk melengkapi persyaratan. Membuat record warehouse tidak memindahkan catatan operasional ke dalam record warehouse, memindahkan record dari beberapa sumber yang menimbulkan masalah besar, terutama yang berkaitan dengan isu yang tidak konsistennya record. Gudang data tidak hanya untuk memuat, mengintegrasikan, dan menyimpan data dalam jumlah besar; mereka juga dapat digunakan untuk mengekstrak data baru dari informasi lama.

Berikut adalah uraian ETL :

  • Ekstaksi

Perlu menentukan sistem database yang akan digunakan dan juga mencari tahu data apa yang diperlukan sebelum mendapatkannya.

  • Transformasi

Agar mengubah data ke dalam data warehouse dengan benar, perlu mengetahui cara pemetaan bidang sumber data eksternal ke data warehouse. Transformasi dapat dilakukan selama ekstraksi data atau saat memuat data ke dalam data warehouse.

  • Loading

Untuk menjamin kesegaran data, data warehouse perlu untuk terus memperbaharui datanya. Banyak persoalan yang perlu untuk dipertimbangkan terutama saat memuat data yang sudah diperbaharui ke data warehouse.

  • Kesimpulan

Basis data yang melacak transaksi penjualan tidak mampu mempromosikan analisis data dan pengambilan keputusan. Dengan menentukan jumlah catatan yang terlibat dan memodifikasi struktur data, data transaksi penjualan aktual dapat digunakan untuk analisis menggunakan bantuan intelijen bisnis yang ada. Gudang data dapat digunakan untuk memberikan pelaporan dan tanggapan atas pertanyaan pelanggan ad hoc, serta melakukan penelitian penjualan menggunakan konsep penjualan silang untuk membantu pengambilan keputusan.

Reference:

https://rully6092.wordpress.com/data-mining-data-warehouse/ https://citaekayana.wordpress.com/2015/10/11/data-warehouse-dan-big-data/ https://candradmy.wordpress.com/2015/10/12/data-warehouse-big-data

William, Edi Purnomo Putra