School of Information Systems

Proses Data Mining CRISP-DM

Dalam perkembangan era jaman sekarang, teknologi sudah sangat maju dan menciptakan inovasi-inovasi baru yang dapat membantu kita untuk mempermudah aktivitas apapun. Salah satunya adalah data mining, apa itu data mining? Data mining adalah proses pengambilan, indentifikasi data yang valid, yang belum diketahui, yang berpotensial berguna, serta mudah dipahami. Biasanya data mining ini juga berfungsi untuk mendapatkan data dari data source atau data warehouse. Mengapa kita menggunakan data mining? Dikarenakan ledakan data dan storage, jadi kita menggunakan data mining untuk mengurangi biaya. Biasanya data mining ini juga dikenal dengans sebutan knowledge extraction, pattern analysis, knowledge discovery, information harvesting, pattern searching, data dredging, dan masi banyak lainnya. Data mining ini adalah campuran dari beberapa multi disciplines ilmu, seperti statistics, artifical intelligence atau biasa dikenal dengan AI, pattern recognition, information visualization, database management and data warehousing, dan yang terakhir adalah management science.

Data mining ini biasanya memiliki sumber dari consolidated data warehouse, namun tidak selalu dari data tersebut saja, lingkungan data mining ini biasanya adalah sebuah client server atau web based information system architecture. Biasanya bagian yang krusial pada data mining ini adalah data itu sendiri, dikarenakan data yang diolah adalah unstructured data atau soft data. Bagaimana cara data mining ini bekerja? Data mining ini biasanya mengekstrak pattern dari suatu data, pattern tersebut bisa didapatkan dari hubungan antara data-data yang diolah.

Data mining ini sudah diterapkan pada kehidupan kita, berikut adalah beberapa contoh penerapan data mining. Yang pertama adalah penerapan data mining pada retailing and logistics, caranya adalah dengan mengambil pattern dari pembelian di supermarket, misalnya setiap orang yang membeli air mineral biasanya akan membeli roti juga, maka strategi yang diterapkan adalah meletakkan air mineral bersebelahan dengan roti, dengan ini maka akan memaksimalkan profit yang didapat oleh suatu supermarket. Lalu ada di bank dan bagian finansial, biasanya di bagian perbankan ini data mining dipakai untuk mendeteksi fraud, bagaimana caranya? Caranya adalah dengan melihat transaksi yang mencurigakan dari akun nasabah, jika misalnya pada jam 1 siang nasabah bertransaksi di Australia lalu 1 jam kemudia dia bertransaksi di Indonesia, lalu 30 menit kemudian bertransaksi di China, pasti ada sesuatu yang salah karena perpindahan tempat orang tersebut tidak mungkin secepat itu. Lalu pada customer relationship management, data mining digunakan untuk mengidentifikasi apa yang paling disukai oleh customer, serta memaksimalkan customer value. Pada bagian manufacture dan maintenance juga data mining digunakan sebagai memprediksi kapan suatu barang akan rusak, serta mengalaisa bagaimana cara meningkatkan produksi sistem yang lebih efisien. Data mining juga bisa digunakan untuk menganalisa saham pada bidang brokerage and securities trading, caranya adalah dengan mengambil data beberapa tahun sebelumnya, lalu bisa memprediksi harga saham untuk kedepannya. Yang terakhir adalah asuransi, data mining juga berguna pada kondisi seperti dimana seseorang ingin mengambil asuransi, lalu pihak perusahaan bisa melakukan data mining terhadap orang tersebut, jika hasil data orang tersebut mungkin sering terkena penyakit atau mudah terkena penyakit maka harga asuransinya pun akan dinaikkan.

 

Proses data mining ini secara umum ada 3, yang pertama yaitu  

  1. CRISP-DM (Cross Industry Standard Process for Data Mining),  
  1. kedua adalah SEMMA (Sample, Explore, Modify, Model, Assess),  
  1. ketiga adalah KDD (Knowledge Discovery in Databases).  

CRISP-DM ini adalah salah satu proses data mining yang paling sering digunakan, CRISP-DM muncul pada tahun 1990 oleh European Consortium. CRISP-DM ini adalah salah satu strategi yang bisa dilakukan oleh suatu perusahaan untuk memecahkan masalah bisnis mereka. Ada 6 langkah untuk melakukan proses data mining CRISP-DM ini, yang pertama adalah business understanding, yang dimaksud disini adalah kita harus memahami dulu bisnis apa yang sedang kita jalankan dan apa kendala yang sedang terjadi seperti, apa yang membuat pelanggan kita kurang tertarik dengan produk kita, dan sebegainya. Langkah kedua adalah data understanding, disini kita harus mengambil data yang sudah tepat atau bisa dibilang data yang sudah kita targetkan, dan juga kita harus melakukan data cleaning yang berfungsi sebagai menghilangkan data-data yang tidak diperlukan agar proses data mining ini berjalan dengan baik. Langkah ketiga adalah data preparation, setalah memahami data, bagian ini adalah bagian yang cukup memakan waktu dikarenakan data yang dipersiapkan harus susah sesuai dengan kriteria yang akan dilakukan pada saat data mining. Langkah keempat adalah model building yaitu kita harus memilih beberapa metode yang sesuai dengan jenis data yang akan dieksekusi, pemilihan metode ini juga cukup berbahaya dikarenakan jika salah dalam memilih metode maka harus mengulang lagi. Langkah kelima adalah testing and evaluation, di bagian ini kita harus melakukan evaluasi terhadap hasil data mining, apakah sudah sesuai? Apakah hasilnya sesuai harapan? Pada langkah ini kita menilai apakah data mining ini berjalan dengan baik atau tidak, dan kita bisa mengambil keputusan apakah akan memakai hasil data mining tersebut untuk diterapkan pada suatu perusahaan.

Langkah terakhir adalah deployment, deployment ini adalah langkah final dimana hasil data mining tersebut diterapkan pada perusahaan dengan harapan dapat menyelesaikan masalah atau hambatan didalam perusahaan. Jadi data mining ini sangat berguna untuk membantu kita dalam menyelesaikan masalah, mulai dari masalah kecil hingga memberikan solusi bagi sebuah perusahaan.

 

Sumber atau referensi: Sharda, R., Delen, D., Turban, E . (2018). Big data Intelligence, Analytics, and Data Science: A Managerial Perspective. 04th Edition. Pearson Education. New Jersey. (PPT)

Jason Emanuel