People Innovation Excellence
 

Penerapan Data Mining Dengan Metode SEMMA

Zaman sekarang ini tentunya istilah data mining tidak asing lagi bagi kita semua. Dimana dengan data mining ini, pengguna dapat mengakses secara cepat data dengan jumlah yang besar. Lebih tepatnya data mining adalah suatu proses ekstraksi atau penggalian data dan informasi yang besar, yang belum diketahui sebelumnya, namun dapat dipahami dan berguna dari database yang besar serta digunakan untuk membuat suatu keputusan bisnis yang sangat penting. Data mining memiliki banyak fungsi diantaranya fungsi deskripsi, fungsi estimasi, fungsi Prediksi, fungsi Klasifikasi, fungsi Clustering dan fungsi asosiasi.

Perkembangan data mining ini menghasilkan suatu metodologi yang bernama SEMMA. SEMMA dibangun oleh SAS Institute, sebuah perusahaan software Sesuai kepanjangannya, SEMMA memiliki 5 tahapan untuk melakukan eksplorasi data yaitu Sample, Explore, Modify, Model and Assess. SEMMA akan memudahkan pengguna untuk menerapkan  teknik-teknik visualisasi dan statistik yang bersifat mencari atau menjelajah, memilih dan men-transformvariable – variabel prediksi yang paling signifikan, memodelkan variable – variabel untuk memprediksi berbagai hasil, dan menkonfirmasi keakurasian suatu model. Berikut gambar penyajian SEMMA:

5 tahapan pada metode SEMMA:

  1. Sample

Tahap ini merupakan opsional yaitu mengambil sampel data dengan mengkstrasi sebagian data yang besar untuk menampung informasi yang signifikan.

  1. Explore

Pada tahap ini data yang sudah dikumpulkan akan diekplorasi dengan mencari tren yang tak terduga dan anomali dalam rangka untuk mendapatkan pengertian dan ide-ide.

  1. Modify

Tahapan ini ialah memodifikasi data dengan menciptakan, menyeleksi dan mentransformasi variabel-variabel untuk fokus pada proses pemilihan model.

  1. Model

Data yang sudah dimodifikasi akan dimodelkan dengan suatu perangkat lunak untuk mencari secara otomatis kombinasi data yang dapat diandalkan untuk memprediksi hasil yang diinginkan.

  1. Assess

Tahap terakhir ialah menilai data dengan mengevaluasi kegunaan dan keandalan penemuan dari proses data miningdan mengevaluasi sebaik mana data tersebut bekerja.

 

Source:

https://www.gurupendidikan.co.id/data-mining/

http://eprints.undip.ac.id/36029/1/Irwan_Budiman.pdf

https://beritati.blogspot.com/2013/08/proses-dalam-data-mining-seri-data.html


Published at :
Leave Your Footprint

    Periksa Browser Anda

    Check Your Browser

    Situs ini tidak lagi mendukung penggunaan browser dengan teknologi tertinggal.

    Apabila Anda melihat pesan ini, berarti Anda masih menggunakan browser Internet Explorer seri 8 / 7 / 6 / ...

    Sebagai informasi, browser yang anda gunakan ini tidaklah aman dan tidak dapat menampilkan teknologi CSS terakhir yang dapat membuat sebuah situs tampil lebih baik. Bahkan Microsoft sebagai pembuatnya, telah merekomendasikan agar menggunakan browser yang lebih modern.

    Untuk tampilan yang lebih baik, gunakan salah satu browser berikut. Download dan Install, seluruhnya gratis untuk digunakan.

    We're Moving Forward.

    This Site Is No Longer Supporting Out-of Date Browser.

    If you are viewing this message, it means that you are currently using Internet Explorer 8 / 7 / 6 / below to access this site. FYI, it is unsafe and unable to render the latest CSS improvements. Even Microsoft, its creator, wants you to install more modern browser.

    Best viewed with one of these browser instead. It is totally free.

    1. Google Chrome
    2. Mozilla Firefox
    3. Opera
    4. Internet Explorer 9
    Close