School of Information Systems

Proses Data Mining KDD

Data mining adalah sebuah kegiatan untuk mengidentifikasi beragam jenis data. Dari banyaknya data yang tersimpan di database, data-data tersebut diidentifikasi baik dicari kemungkinan adanya pola ataupun lainnya yang dianggap berpotensi untuk menghasilkan sesuatu yang bisa dipakai oleh organisasi atau perusahaan yang memiliki database tersebut. Data mining itu sendiri meiliki beragam metode yang bisa digunakan yaitu KDD, CRISP-DM, SEMMA, dll. Setiap proses memiliki metode yang berbeda-beda dalam pencarian informasi penting yang ada di dalam database orgnisasi. Pada artikel ini kita akan membahas KDD atau Knowledge Discovery in Database Process.

Knowledge Discovery in Database Process (KDD) adalah salah satu metode yang bisa digunakan dalam melakukan data mining. Fayyed et al. (1996) mendefinisikan KDD sebagai proses dari menggunakan metode data mining untuk mencari informasi-informasi yang berharga, pola yang ada di dalam data, yang melibatkan algoritma untuk mengidentifikasi pola pada data. Dunham (2003) meringkas proses KDD dari berbagai step, yaitu: seleksi data, pra-proses data, transformasi data, data mining, dan yang terakhir interpretasi dan evaluasi. Berikut adalah ilustrasi serta penjelasan menegenai proses KDD secara detail:

Gambar 1.1

  1. Data Cleansing, Proses dimana data diolah lalu dipilih data yang dianggap bisa dipakai.
  2. Data Integration, Proses menggabungkan data yang dianggap berulang akan digabungkan menjadi satu.
  3. Selection, Proses seleksi atau pemilihan data yang dianggap relevan terhadap analisis.
  4. Data Trasnformation, Proses transformasi data terpilih ke dalam bentuk mining procedure.
  5. Data Mining, Proses dimana dilakukan beragam teknik untuk mengekstrak pola-pola potensial menghasilkan data yang berguna.
  6. Pattern Evolution, Proses dimana pola-pola yang telah diidentifikasi berdasarkan measure yang diberikan.
  7. Knowledge Presentation, Proses paling akhir dari proses KDD, Data-data yang sudah diproses divisualisasikan agar lebih mudah dipahami oleh pengguna dan diharapkan bisa diambil Tindakan berdasarkan analisis.

Itulah gambaran serta penjelasan dari proses-proses KDD data mining. Data mining hanyalah salah satu dari beragam metode yang bisa digunakan dalam data mining. Seperti yang dijelaskan di awal, tujuan dari proses KDD ini adalah untuk mencari potensi dari data yang diambil dari database yang natinya akan dipelajari melalui pola lalu dianalisis serta divisualisasikan sehingga mudah dipahami oleh pengguna. Secara umum berikut adalah tiga jenis task yang biasa dilakukan pada data mining, termasuk di dalam Knowledge Discovery in Database Process (KDD).

  • Prediction

Prediksi didefinisikan sebagai sebuah tindakan untuk mencari tahu apa yang akan terjadi di masa yang akan datang. Dari data yang sudah diolah maupun yang sudah divisualisasikan, bisa saja pengguna memprediksi apa yang kemungkinan terjadi berdasarkan pola yang didapatkan.

  • Association

Asosiasi adalah sebuah teknik untuk mencari hubungan dari data dari beragam variable data. Dari beragam variable data bisa saja 2 atau lebih diantaranya memiliki hubunga positif yang artinya kedua variable data ini saling berkaitan sehingga data tersebut bisa digunakan dalam data mining.

  • Segmentation

Pada segmentation setiap data diklasifikan pada cluster dimana data yang memiliki karakteristik yang mirip akan dikelompokan.

Pada setiap proses data mining perusahaan atau organisasi akan menggunakan software untuk mempermudah mereka dalam mengolah data yang ada di database. Berikut adalah contoh-contoh software yang bisa digunakan untuk data mining: Microsoft SQL Server, Oracle Data Mining, Rapid Miner, dll.

Referensi

  • Intermedia, Beon. (2020, Maret 17). Data Mining : Definis, Fungsi, Metode dan Penerapannya. Diakses pada 14 Oktober 2020, dari https://www.jagoanhosting.com/blog/apa-itu-data-mining/
  • Turban, E., Delen, D., & Sharda, R. (2018). Business intelligence, analytics, and data science: A managerial perspective. Harlow ; Munich: Pearson Prentice Hall.
Andi Fahlevi_