Metode Data Mining : Association
A. Pengertian Data Mining
Data mining adalah proses non trivial dari penarikan identifikasi data yang valid dan berpotensi berguna dan mudah dipahami. Pramudiono mengatakan Data Mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual. Tugas dari data mining sendiri adalah menganalisa data dimana hasil dari analisa ini digunakan untuk dashboard. Data mining ini berasal dari Data Warehouse yang sudah terintegrasi. Data mining menggambarkan sebuah pengumpulan dengan tujuan menemkan pola yang tidak diketahui pada data yang sudah dikumpulkan. Data Mining mengidentifikasi fakta yang disarankan berdasarkan data untuk mengeksplor pola data. Contoh data mining pada asuransi, perusahaan asuransi A menggunakan data mining untuk mengindentifikasi layanan kesehatan yang tidak di perlukan masyrakat tetapi mereka mengikuti atau mengikuti layanan tersebut. Tahapan data mining sebagai berikut:
- Data Cleaning, menghilangkan noise data yang tidak konsisten.
- Data Integration, sumber data yang terpecah nanti akan disatukan.
- Data selection, data yang relevan dengan tugas analisis.
- Data transformation, data berubah menjadi bentuk yang tepat.
- Data mining, proses dimana metode yang intelejen digunakan untuk mengekstrak data
- Pattern evolution, mengidentifikasi pola yang sungguh menarik yang mewakili pengetahuan berdasarkan beberapa tindakan yang unik
- Knowledge presentation, gambaran visualisasi dan pengetahuan yang digunakan untuk memberikan pengetahun kepada user.
B. Metode Data Mining
Terdapat beberapa metode dalam data mining, yaitu Descriptive, Predictive, Estimation, Clarification, Clustering and Association. Namun yang saya bahas hanya Association. Association dalam dunia bisnis sering disebut dengan Market Basket Analysis. Association ini adalah metode data mining yang bertujun mencari kumpulan items atau pola yang sering muncul bersamaan. Tugas association berusaha untuk mengungkapkan hubungan antara dua atau lebih item. Association rule ini umumnya IF-Then. Ada beberapa hal yang digunakan untuk mengukur sekumpulan items ini sering muncul bersamaan atau tidak. Dalam menentukan suatu association rule, terdapat suatu interestingness measure yang didapat dari hasil pengolahan data dengan perhitugan tertentu, yaitu:
- Support of an item set, persentase dari semua transaksi yang terjadi.
- Confidence of an association, kuatnya hubungan antar item dalam association rule.
Contohnya (Mie Instan, Telur) → (Saus) (Support 40%, confidence 50%) artinya seorang konsumen membeli mie instan dan telur memiliki kemungkinan 50% untuk membeli saus. Dalam menentukan suatu association rule, terdapat suatu interestingness measure yang didapat dari hasil pengolahan data dengan perhitugan tertentu. Analisa association untuk menemukan yang memenuhi syarat minimum untuk support dan syarat minimum untuk confisence. Kelemahan dari metode ini hraus melakukan scan database setiap kali iterasi, memerlukan waktu yang banyak untuk iterasi. Ukuran dalam data mining ini akan berguna dalam menentukan interesting association rule. Pada market basket analysis, metode yang digunakan untuk mengetahui hubungan antara produk dalam suatu transaksi. Market Basket Analysis ini biasanya digunakan pada swalayan, dimana kita dapat mengetahui hubungan setiap item yang terdapat pada keranjang pelanggan. Dengan informasi yang di ini, dapat membuat keputusan dan kebijakan. Informasi yang dihasilkan oleh Data Mining akan digunakan oleh Management. Tahapan Metode Analisa Association rule:
- Extraction, proses pengambilan data dari sumber data yang selanjutnya diproses untuk pengolaha data ketingkat selanjutnya.
- Preprocessing, tidak semua data digunakan dalam proses data mining, pada proses ini dilakukan agar data yang akan digunakan sesuai.
- Data siap mining, sampel data yang siap untuk dianalisa. Data yang dianalisa adalah data yang telah melalui preprocessing.
- Algoritma, menggunakan pengetahuin frequent itemset, menemukan kombinasi dari item, yang memiliki support yang lebih besar daripada minimum support.
- Rule, proses setelah frequent itemset dari analisis tersebut, lalu mencari confidence dari frequent itemset.
Referensi :
https://core.ac.uk/download/pdf/35382238.pdf
https://www.kajianpustaka.com/2017/09/data-mining.html