Mengenal Apa itu Data Mining
Pengertian Data Mining Menurut Para Ahli
Beberapa para ahli telah menjelaskan pengertian data mining, diantaranya adalah:
- Larose
Pengertian data mining merupakan proses menemukan sesuatu yang bermakna oleh suatu pola dengan cara memilah-milah data yang berukuran besar, dimana data tersebut disimpan dalam repository, sehingga menggunakan statistik dan teknik matematika.
- Pramudiono
Menurut Pramudiono, pengertian data mining adalah analisa yang dilakukan secara otomatis pada data besar dan kompleks dengan tujuan untuk mendapatkan pola penting yang keberadaannya biasanya tidak disadari.
- Hoffer dan McFadden
Pengertian data Mining ialah penemuan pengetahuan yang menggunakan teknik-teknik dari statistik, tradisional, serta grafik komputer.
- Berry
Sedangkan menurut Berry, pengertian data mining merupakan aktivitas menganalisis data dalam jumlah yang besar untuk menemukan pattern (pola) dan rule (aturan) yang berguna.
Fungsi Data Mining
Data Mining memiliki beberapa fungsi, yaitu:
- Descriptive
Descriptive merupakan suatu fungsi yang bertujuan memahami lebih jauh mengenai data yang diamati sehingga dapat diketahui perilaku dari sebuah data.
- Predictive
Fungsi ini adalah sebuah fungsi yang menjelaskan suatu proses dalam menemukan pola tertentu dari sebuah data. Pola-pola yang digunakan diketahui dari beragam variabel yang terdapat pada data.
- Classification
Fungsi ini bertujuan untuk menyimpulkan beberapa definisi karakteristik dari sebuah grup. Contoh: pelanggan-pelanggan perusahaan yang telah berpindah kesaingan perusahaan yang lain
- Clustering
Clustering adalah identifikasi kelompok dari produk-produk atau barang-barang yang memiliki karakteristik khusus.
- Association
Association merupakan identifikasi hubungan dari kejadian-kejadian yang sudah terjadi di suatu waktu.
- Sequencing
Sequencing sebetulnya hampir sama dengan association tetapi untuk sequencing berfungsi untuk identifikasi hubungan-hubunga berbeda di sebuah periode waktu tertentu. Contohnya, para pelanggan yang berkunjung di supermarket secara berulang.
- Forecasting
Fungsi ini bertujuan untuk memperkirakan nilai di suatu masa di masa mendatang sesuai dengan pola-pola dengan kumpula data dalam jumlah besar. Contohnya, peralaman permintaan pasar.
Tujuan Data Mining
Setipa proses dari data mining memiliki tujuannya masing-masing, berikut ini tujuan yang terdapat pada data mining:
- Explanatory (Sarana Penjelasan)
Data mining adalah sebuah sarana untuk menjelaskan suatu kondisi. Sebagai contoh nyata yaitu mengapa harga penjualan masker di Indonesia meningkat. Tentu saja dalam mengetahui alasannya, diperlukan kumpulan data yang diperoleh dari hasil data mining.
- Confirmatory (Konfirmasi)
Data mining adalah sebuah sarana untuk mengklarifikasi sebuah pernyataan atau mempertegas adanya hipotesa. Contohnya adalah orang dengan tingkat ekonomi menengah keatas lebih suka membeli mobil daripada membeli unit sepeda motor.
- Exploratory (Eksplorasi)
Data mining adalah suatu sarana yang dapat digunakan untuk mencari pola baru yang sebelumnya tidak terdeteksi. Contohnya adalah pola terkait alasan mengapa seorang pelaku pembunuhan menargetkan orang yang tinggal di apartemen seorang diri (walau korban tidak terikat hubungan kontak apapun dengan pelaku).
Metode Data Mining
- Proses Pengambilan Data
- Data Cleansing
Proses dimana data-data yang tidak lengkap, mengandung error dan tidak konsisten dibuang dari koleksi data. Ketahui juga data lifecycle management untuk mengetahui tentang pengolahan data.
- Data Integration
Proses integrasi data dimana yang berulang akan dikombinasikan.
- Selection
Proses seleksi atau pemilihan data yang relevan terhadap analisis untuk diterima dari koleksi data yang ada.
- Data Transformation
Proses transformasi data yang sudah dipilih ke dalam bentuk mining procedure melalui cara dan agresi data.
- Data Mining
Proses yang paling penting dimana akan dilakukan berbagai teknik yang diaplikasikan untuk mengekstrak berbagai pola-pola potensial untuk mendapatkan data yang berguna.
- Pattern Evolution
Sebuah proses dimana pola-pola menarik yang sebelumnya sudah ditemukan dengan identifikasi berdasarkan measure yang telah diberikan
- Knowledge Presentation
Merupakan proses tahap terakhir, Dalam hal ini digunakan teknik visualisasi yang bertujuan membantu user dalam mengerti dan menginterpretasikan hasil dari penambangan data.
- Proses Penambangan Data
- Predictive Modeling
Terdapat dua teknik yaitu Classification dan Value Prediction
- Database Segmentation
Melakukan partisi database menjadi sejumlah segmen, cluster, atau record yang sama.
- Link Analysis
Sebuah teknik untuk membuat hubungan antara record yang individu atau sekumpulan record dalam database.
- Deviation Detection
Sebuah teknik untuk mengidentifikasi outlier yang mengekspresikan sebuah deviasi dari ekspektasi yang sudah diketahui sebelumnya.
- Nearest Neighbour
Teknik yang memprediksi pengelompokan, Teknik ini sendiri merupakan teknik yang tertua yang digunakan dalam data mining.
- Clustering
Merupakan teknik untuk mengklasifikasikan data berdasarkan kriteria masing-masing data.
- Decision Tree
Merupakan teknik generasi selanjutnya, dimana teknik ini adalah sebuah model prediktif yang dapat digambarkan seperti pohon. Setiap node yang terdapat dalam struktur pohon tersebut mewakili sebuah pertanyaan yang digunakan untuk menggolongkan data.
Referensi:
https://www.diadona.id/d-stories/pengertian-data-mining-dan-contohnya-menurut-para-ahli-200707m.html
https://idcloudhost.com/apa-itu-data-mining-definisi-fungsi-metode-dan-penerapannya/