School of Information Systems

Data Mining dan Pengaplikasianya

Seperti yang digambarkan pada gambar diatas, Data Mining adalah campuran dari berbagai jenis disiplin ilmu.

Data Mining adalah proses pengambilan dan identifikasi data yang valid, berguna, potensial, dan mudah dipahami dalam data yang disimpan dalam database terstruktur. Dalam data mining, data adalah unsur paling penting yang dapat mencakup data lunak (soft data) atau data tidak terstruktur (unstructured data). Proses data mining seringkali menggunakan metode statistika, matematika, hingga memanfaatkan teknologi artificial intelligence. Data Mining memiliki sebutan lain yaitu knowledge extraction, pattern analysis, knowledge discovery, information harvesting, pattern searching, data dredging, dan lain-lain. Dalam data mining, sumber data untuk data mining seringkali berupa datawarehouse yang terkonsolidasi. Lingkungan data mining juga biasanya berupa client-server atau Web-based information systems architecture.

Data Mining memiliki fungsi yaitu fungsi descriptive dan fungsi predictive. Fungsi descriptive dalam data mining adalah untuk memahami lebih jauh tentang data yang diamati yang kemudian dapat menemukan pola yang tersembunyi dalam sebuah data. Fungsi Predictive dalam data mining adalah fungsi bagaimana sebuah proses akan menemukan pola tertentu dari suatu data yang kemudian pola tersebut dapat digunakan untuk memprediksi variable lain yang belum diketahui nilai atau jenisnya. Sehingga, dapat dikatakan bahwa tujuan dari data mining adalah untuk menemukan pola yang tersembunyi dalam tumpukan data. Yang akan dibahas disini adalah Data Mining untuk predictive analysis.

Tujuan dari data mining untuk predictive analysis adalah untuk menemukan pola yang tersembunyi yang berguna dalam data yang kemudian dapat digunakan untuk melakukan predictive analysis. Yaitu menganalisis data untuk hubungan yang baru yang tidak di harapkan, seperti halnya pola apa yang cocok untuk kasus penggelapan kartu kredit (explanatory). Data Mining dapat digunakan untuk mendeteksi kecurangan (fraud). Contohnya, kecurangan dalam transaksi kartu kredit sehingga dapat terdeteksi bahwa transaksi dalam kartu kredit tersebut tidak dilakukan oleh pemilik kartu kredit tersebut melainkan orang lain. Selain itu, transaksi kecurangan dalam Tokopedia dimana dapat mendeteksi kecurangan seperti transaksi yang dilakukan hanya untuk mendapatkan cashback dari Tokopedia dan kemudian pembayaran yang dilakukan akan dikembalikan via transfer bank oleh toko kepada customer yang melakukan transaksi pembelian hanya karena ingin mendapatkan cashback.

Cara kerja data mining adalah dengan mengekstrak pattern (pola) dalam suatu data. Pattern disini berarti hubungan matematis baik numerik atau simbolik antara item data. Dengan demikian, kita dapat mengetahui bagaimana perilaku orang-orang misalnya saat berbelanja di supermarket. Seperti contohnya dengan data mining, dapat diketahui bahwa susu dan cereal sangat berkaitan dimana kebanyakan orang yang membeli susu pasti akan membeli cereal. Dengan begitulah data mining ini dapat membantu kita untuk menganalisa penaruhan barang di rak untuk kedepannya yaitu dengan menaruh susu berdekatan dengan cereal atau dengan memberikan promo paket susu dan cereal dan sebagainya.

Selain itu, pengaplikasian data mining juga dapat dilakukan pada berbagai bidang lainnya. Diantaranya yaitu :

  • Customer Relationship Management (CRM), yaitu dengan tujuan untuk memanage hubungan dengan customer, memaksimalkan laba atas kampanye pemasaran, mengidentifikasi pelanggan yang bernilai dan memberikan perlakuan khusus.
  • Banking and Financial, yaitu mendeteksi kecurangan pada transaksi.
  • Retailing and Logistics, yaitu dapat mengoptimalkan tingkat inventaris di berbagai lokasi yang berbeda, memperbaiki tata letak toko dan promosi penjualan, dsb.
  • Manufacturing and Maintenance, yaitu memprediksi atau mencegah kegagalan pada mesin serta menemukan pola baru untuk meningkatkan kualitas produk.
  • Brokerage and Securities Trading, yaitu memprediksi perubahan harga saham sehingga kita dapat mengetahui waktu yang tepat untuk membeli atau menjual saham, melakukan forecast arah stock apakah naik atau turun serta mengidentifikasi tindakan kecurangan pada aktivitas trading.
  • Insurance, yaitu memprediksi perkiraan biaya klaim untuk perencanaan bisnis yang lebih baik, menentukan skema harga optimal, serta mengidentifikasi dan mencegah kecurangan (fraud) dalam aktivitas klaim.

Proses dari data mining yang paling umum adalah CRISP-DM (Cross Industry Standard Process for Data Mining), SEMMA (Sample, Explore, Modify, Model, Assess), KDD (Knowledge Discovery in Databases Process. Serta, metode dari data mining adalah classification dan clustering dimana metode yang paling umum digunakan adalah classification. Selain dari itu, juga ada association, prediction, dan sequential.

Referensi:

Audrey Megan