School of Information Systems

Penerapan Data Mining Dengan Metode SEMMA

Zaman sekarang ini tentunya istilah data mining tidak asing lagi bagi kita semua. Dimana dengan data mining ini, pengguna dapat mengakses secara cepat data dengan jumlah yang besar. Lebih tepatnya data mining adalah suatu proses ekstraksi atau penggalian data dan informasi yang besar, yang belum diketahui sebelumnya, namun dapat dipahami dan berguna dari database yang besar serta digunakan untuk membuat suatu keputusan bisnis yang sangat penting. Data mining memiliki banyak fungsi diantaranya fungsi deskripsi, fungsi estimasi, fungsi Prediksi, fungsi Klasifikasi, fungsi Clustering dan fungsi asosiasi.

Perkembangan data mining ini menghasilkan suatu metodologi yang bernama SEMMA. SEMMA dibangun oleh SAS Institute, sebuah perusahaan software Sesuai kepanjangannya, SEMMA memiliki 5 tahapan untuk melakukan eksplorasi data yaitu Sample, Explore, Modify, Model and Assess. SEMMA akan memudahkan pengguna untuk menerapkan  teknik-teknik visualisasi dan statistik yang bersifat mencari atau menjelajah, memilih dan men-transformvariable – variabel prediksi yang paling signifikan, memodelkan variable – variabel untuk memprediksi berbagai hasil, dan menkonfirmasi keakurasian suatu model. Berikut gambar penyajian SEMMA:

5 tahapan pada metode SEMMA:

  1. Sample

Tahap ini merupakan opsional yaitu mengambil sampel data dengan mengkstrasi sebagian data yang besar untuk menampung informasi yang signifikan.

  1. Explore

Pada tahap ini data yang sudah dikumpulkan akan diekplorasi dengan mencari tren yang tak terduga dan anomali dalam rangka untuk mendapatkan pengertian dan ide-ide.

  1. Modify

Tahapan ini ialah memodifikasi data dengan menciptakan, menyeleksi dan mentransformasi variabel-variabel untuk fokus pada proses pemilihan model.

  1. Model

Data yang sudah dimodifikasi akan dimodelkan dengan suatu perangkat lunak untuk mencari secara otomatis kombinasi data yang dapat diandalkan untuk memprediksi hasil yang diinginkan.

  1. Assess

Tahap terakhir ialah menilai data dengan mengevaluasi kegunaan dan keandalan penemuan dari proses data miningdan mengevaluasi sebaik mana data tersebut bekerja.

 

Source:

https://www.gurupendidikan.co.id/data-mining/

http://eprints.undip.ac.id/36029/1/Irwan_Budiman.pdf

https://beritati.blogspot.com/2013/08/proses-dalam-data-mining-seri-data.html

Nur Anisa