Types of patterns : Association, Prediction, Cluster (segmentation) dan Sequential (or time series) Relationship
Types of Pattern
- Association
Merupakan suatu teknik yang digunakan untuk menemukan hubungan antar beberapa variabel yang berukuran besar dalam suatu database. Association termasuk bagian dari machine learning. Pattern ini bekerja secara unsupervised yang sering dikenal dengan sebutan analisa keranjang belanja (market-basket analysis). Pada association ini terdapat bagian input dan output yang perlu diperhatikan. Input merupakan data sederhana point-of-sale transaction dan sedangkan output merupakan afinitas paling sering di antara item.
Contoh penggunaan
Contoh penggunaan association yaitu pada sebuah toko grosir. Setiap transaksi yang terjadi di toko grosir tersebut akan dicatat dan tersimpan di dalam database. Association memiliki peran untuk membaca pola atau kecenderungan pembelian konsumen. Misal dari 50 transaksi, terdapat 25 transaksi yang menggunakan pola yang sama, yaitu konsumen akan membeli beras jika mereka juga membeli telur. Hasil pola tersebut akan dimanfaatkan dengan prinsip association dan kemudian akan menghasilkan informasi terkait produk apa saja yang sering dibeli oleh konsumen secara bersamaan. Dari hasil informasi tersebut, pihak manajemen akan melakukan replace produk yang sering dibeli bersamaan oleh konsumen agar produk tersebut dapat dilihat oleh konsumen. Pada contoh ini, pihak manajemen akan meletakkan beras dan telur secara berdekatan agar dapat mendorong konsumen untuk membeli keduanya. Selain itu, association juga dapat digunakan untuk menilai produk mana sajakah yang jarang dibeli dan sering dibeli oleh konsumen hal ini untuk mengurangi penumpukan stok di gudang.
- Predictions
Predictions merupakan salah satu pattern pada data mining yang sering digunakan. Pada konsep predictions, analisis dilakukan dengan menggunakan pola yang ditemukan dalam data historis atau data saat ini untuk diperluas ke masa depan. Dengan demikian, konsep ini akan menghasilkan suatu perkiraan tren apa saja yang akan datang berikutnya pada data perusahaan. Contoh penggunaan predictions yaitu untuk memprediksi suhu pada hari tertentu.
- Cluster (segmentation)
Merupakan suatu teknik atau cara untuk mengidentifikasi pengelompokkan hal-hal berdasarkan berbagai karakter yang sudah diketahui. Sehingga suatu kelompok tersebut memiliki item-item yang memiliki lebih banyak kesamaan satu sama lain dibandingkan item-item yang terdapat pada cluster lain. Cluster Analysis merupakan suatu patterns yang masih tergabung dalam kelompok machine learning. Selain itu, cluster analysis juga digunakan untuk membagi kumpulan hal misalnya objects atau events sehingga setiap karakteristik dalam grup tersebut dapat diidentifikasi. Pembagian ini akan menghasilkan suatu segmen-segmen berdasarkan kesamaan karakteristik.
Clustering yang baik memiliki sifat:
- Homogenitas (kesamaan), yaitu memiliki tingkat kesamaan yang tinggi antar anggota dalam suatu cluster.
- Heterogenitas (perbedaan), yaitu memiliki tingkat perbedaan yang tinggi antar sesama cluster.
- Sequential (or time series) Relationship
Sequential relationships : Bisa digunakan untuk mendapatkan atau mencari pola pada sebuah rangkaian peristiwa kejadian. Berbagai macam hubungan dapatditeliti berdasarkan urutan kejadian untuk mengidentifikasi ‘association terhadap waktu’
salah satu contohnya sebuah DNA terdiri dari rangaian bagian: A, G, C, dan T. dan rangkaian klik pada sebuah website berisi rentetan URL. Pada kejadian nyata anda mungkin memodelkan pembelian oleh pelanggan sebagai sebuah sequence (rangkaian) data, rangkaian tersebut adalah:
- Pertama-tama Seorang pelanggan membeli komputer
- kemudian membeli speaker
- dan akhirnya membeli sebuah webcam.
Time series dan sequential memliki perbedaan dimana time series berisi tipe data bertipe numerik dan sequential series berisi bagian yang khas.
Referensi:
https://www.alfasoleh.com/2019/09/data-mining-contoh-sederhana-penerapan.html