Pengenalan Data Mining
Data Mining adalah proses analisa untuk menemukan hubungan yang mempunyai arti, pola dan kebiasaan pada suatu data yang berukuran besar, dengan menggunakan teknik statistik, matematika, kecerdasan buatan, dan machine learning untuk mendapatkan informasi dan pengetahuan yang bermanfaat dan yang terkait dari suatu database. Data mining adalah gabungan dari berbagai macam ilmu yang menggabungkan teknik dari statistik, database, pembelajaran mesin, pengenalan pola, serta visualisasi yang nantinya digunakan untuk penanganan pengambilan informasi dari database yang besar (Mardi, 2017).
Data Mining berupa pencarian tren atau pola yang diinginkan pada database besar untuk membantu pengambilan keputusan di saat yang akan datang. Pola-pola ini dikenali oleh perangkat tertentu yang bisa memberikan suatu analisa data berguna dan berwawasan yang kemudian bisa dipelajari dengan lebih teliti. (Hermawati, 2013).
Data mining memiliki beberapa pengertian penting yang lebih mendalam, yaitu:
- Data mining adalah proses data yang dilakukan secara otomatis.
- Data yang akan diproses adalah data yang besar.
- Data mining bertujuan untuk menemukan pola yang dapat memberikan informasi yang bermanfaat.
Data mining sendiri dibagi menjadi beberapa jenis berdasarkan dengan tugas yang dilakukan, yaitu:
- Deskripsi
Teknik deskripsi biasanya digunakan untuk memberikan penjelasan terhadap suatu pola atau kecenderungan dalam suatu data. Sebagai contoh, di saat pemilu petugas pengumpulan suara tidak bisa menentukan keterangan fakta yang menjelaskan bahwa pasangan calon yang dianggap kurang profesional akan mendapat dukungan yang sedikit dalam pemilihan presiden (Mardi, 2017). - Estimasi
Variabel target estimasi kurang lebih sama dengan klasifikasi, yang membedakan hanyalah variabel targetnya lebih mengarah ke numerik daripada ke arah kategori. Model yang dibangun dari teknik estimasi ini menggunakan record yang di dalamnya menyediakan variabel target sebagai nilai prediksi (Mardi, 2017). - Prediksi
Dalam tugas prediksi, nilai dari hasil akan terjadi dimasa yang akan datang. Contoh prediksi adalah:
• Prediksi harga kacang dalam 3 bulan kedepan
• Prediksi tingkat harapan hidup di suatu daerah
• Prediksi kenaikan kecelakan lalu lintas pada saat musim lebaran
Dalam tugas prediksi ini, beberapa metode atau teknik yang digunakan dalam metode klasifikasi dan estimasi dapat diterapkan dalam keadaan yang tepat untuk membantu prediksi (Mardi, 2017). - Klasifikasi
Sesuai namanya, metode klasifikasi memiliki variabel target kategori. Dimana terjadi penggolongan atau pengelompokan berdasarkan suatu keadaan tertentu. Sebagai contoh, penggolongan mahasiswa dipisahkan dalam dua kategori, yaitu mahasiswa berprestasi dan mahasiswa kurang berprestasi (Mardi, 2017). - Clustering
Tugas Clustering adalah pengelompokan kelas objek yang memiliki kemiripan satu dengan lain, dan tidak memiliki kemiripan apapun dengan kelas objek lainnya. Tugas Clustering hampir sama dengan tugas klasifikasi, tapi hal yang membedakannya adalah tidak ada variabel target dalam Clustering. Pada clustering, tidak ditemukan atau tidak mencoba untuk melakukan apa yang dilakukan pada teknik klasifikasi, yaitu memprediksi nilai atau estimasi dari variabel target. Melainkan teknik clustering akan menggunakan algoritma yang melakukan pembagian terhadap keseluruhan data menjadi kelompok-kelompok yang memiliki kemiripan. Sebagai contoh, mendapatkan kelompok-kelompok konsumen untuk target pemasaran dari suatu perusahaan (Mardi, 2017). - Asosiasi
Asosiasi dalam data mining yaitu menemukan suatu hubungan yang terdapat pada nilai atribut dari sekumpulan data yang ada. Biasanya asosiasi dalam dunia bisnis sering disebut analisis keranjang belanja. Sebagai contoh, menemukan barang apa saja yang dibeli secara bersamaan dan barang yang tidak pernah dibeli secara bersamaan pada suatu toko (Mardi, 2017).
Referensi:
Mardi, Y. (2017). Data Mining: Klasifikasi Menggunakan Algoritma C4.5. 213-219.
Hermawati, F. A. (2013). Data Mining. Yogyakarta: Penerbit Andi.