Metode Data Mining
Data mining merupakan suatu kegiatan yang dilakukan dengan tujuan menemukan pola atau informasi penting yang ada pada data yang disimpan di dalam database. Database menyimpan data yang besar berisi data numerik ataupun non numerik yang diolah untuk menghasikan sesuatu yang dapat digunakan oleh perusahaan. Proses data mining dilakukan dengan menggunakan berbagai metode yaitu KDD, CRISP-DM, SEMMA, dll. Pada artikel ini kita akan membahas KDD dan CRISP-DM.
- KDD
KDD (Knowledge Discovery in Database Process) adalah sebuah proses yang sistematis dalam mencari pola atau pattern dalam mengekstrak informasi dari dalam database dengan menggunakan algoritma. Tujuan dari KDD adalah untuk menghasilkan pengetahuan baru yang dapat membantu perusahaan dalam pengambilan keputusan yang lebih baik. Adapun proses KDD:
- Data Cleaning
- Data Integration
- Selection
- Data Transformation
- Data Mining
- Pattern Evolution
- Knowledge Presentation
- CRISP-DM
CRISP-DM (Cross-Industry Standard Process for Data Mining) adalah sebuah proses standar dalam menganalisis data dengan setiap tahapan yang saling terkait dan dapat diulang-ulang. Tujuan dari CRISP-DM adalah untuk membantu perusahaan dalam mengelola dan menganalisis data dengan efektif, serta menghasilkan wawasan baru yang dapat mendukung pengambilan keputusan yang lebih baik. Adapun proses CRISP-DM:
- Business Understanding
- Data Understanding
- Data Preparation
- Modeling
- Evaluation
- Deployment
KDD dan CRISP-DM sama-sama memiliki tujuan untuk melakukan data mining dengan efektif. Dalam melakukan data mining, penting untuk mempertimbangkan proses yang tepat untuk mencapai tujuan bisnis. Oleh karena itu, pemilihan proses yang tepat seperti KDD atau CRISP-DM menjadi kunci dalam mencapai kesuksesan dalam melakukan data mining.