Faktor Keberhasilan dan Kegagalan dalam Penerapan Data Mining
Definisi data mining
Pengertian dari data mining merupakan suatu metode yang dilakukan untuk melakukan pencarian data penting, serta penambahan suatu pengetahuan dari sebuah data yang besar. Data mining memanfaatkan proses metode statistika, metode matematika, serta pemanfaatan artificial intelligent (AI), untuk melakukan ekstrak serta melakukan identifikasi terhadap data yang diperoleh untuk mencari data yang dapat dimanfaatkan serta digunakan sebagai penambah pengetahuan dari data besar yang tersedia.
Fungsi data mining
Data mining memiliki fungsi yang bisa terbilang sangat penting untuk pengumpulan data yang berguna serta menambah pengetahuan dari si pengekstrak. Berikut beberapa contoh fungsi dari data mining:
1. Fungsi Prediksi (prediction). Proses yang dilakuakn untuk menemukan suatu pola – pola dari data, kita dapat mengetahui pola – pola tersebut dengan menggunakan beberapa variabel untuk memprediksikan variabel lain yang tidak diketahui jenis atau nilainya.
2. Fungsi Deskripsi (description). Proses ini dilakukan demi mendapat pemahaman lebih mengenai data yang sedang di teliti, dan kemudian data itulah yang digunakan untuk menemukan suatu karakteristik penting dari data yang di teliti.
3. Fungsi Klasifikasi (classification). Klasifikasi merupakan suatu proses untuk menemukan model atau fungsi untuk menggambarkan class atau konsep dari suatu data. Proses yang digunakan untuk mendeskripsikan data yang penting serta fungsi ini melibatkan karakteristik data yang telah di temukan dari proses description untuk memasukan suatu objek kedalam data yang di tentukan.
4. Fungsi Asosiasi (association). Proses ini digunakan untuk menemukan suatu hubungan yang terdapat pada nilai atribut dari sekumpulan data. Atribut juga dilakukan untuk menentukan untuk mengukur suatu ukuran antara dua variable.
Faktor kegagalan data mining
Terdapat beberapa faktor yang dapat terjadi yang menyebabkan kegagalan dalam data mining, berikut beberapa faktor – faktor nya:
1. Terdapat kesalahan dalam pemilihan permasalahan untuk data mining.
Hal ini dapat terjadi karena permasalahan yang dipilih, ternyata tidak dapat diselesaikan dengan menggunakan data mining.
2. Mengabaikan apa yang sponsor pikirkan mengenai apa itu data mining dan apa yang bisa dilakukan dengan data mining dan apa yang tidak bisa dilakukan oleh data mining.
Untuk menghindari kesalahan tersebu, kita harus mengetahui apa yang sponsor pikirkan mengenai apa itu data mining, dan kita harus memberi pengetahuan mengenai apa sebenarnya data mining itu, dan apa yang bisa dilakukan dan tidak dilakukan dengan data mining.
3. Memulai proses data mining, namun tidak memikirkan bagaimana akhir atau tujuan dari proses data mining tersebut.
Apabila kita ingin memulai proses dari data mining, kita harus memikirkan secara menyeluruh dari awal hingga akhir yang akan terjadi, serta memprediksi apakah data mining berhasil atau tidak. Jika kita tidak memikirikan bagaimana akhir dari data mining, maka proses data mining akan berakhir dalam kegagalan.
4. Tidak memberikan waktu yang cukup untuk melakukan akuisisi, seleksi dan persiapan data.
Untuk memastikan kelancaran dari proses data mining, kita memerlukan waktu yang banyak dan boleh terburu – buru, apabila kita terlalu terburu – buru maka aka nada suatu proses yang terlewat atau mendapat hasil yang kurang maksimal.
5. Hanya melihat hasil agregat dan bukan pada catatan / prediksi individu
Faktor kesuksesan data mining
1. Tujuan bisnis yang sudah jelas ingin dicapai perusahaan dengan menggunakan penambangan Big Data
2. Relevansi sumber data untuk menghindari duplikasi dan hasil yang tidak perlu
3. Kelengkapan data untuk memastikan semua informasi penting tercakup
4. Penerapan hasil analisis Big Data untuk memenuhi tujuan yang ditentukan
5. Keterlibatan pelanggan dan pertumbuhan garis bawah sebagai indikator keberhasilan data mining
Contoh case study
Sebuah rumah sakit ingin ingin menekan biaya perawatan pasien tanpa mengurangikualitas pelayanan. Salahsatu potensi yang dapat dimanfaatkan pada penerapan data mining di rumah sakit adalah mengidentifikasi atribut-atribut penentu biaya pasien rawat inap. Dengan mengetahui atribut penentu biaya rawat, diharapkan pihak manajemen rumah sakit dapat melakukan kontrol terhadap biaya, sehingga ongkos perawatan pasien dapatditekan tanpa mengurangi kualitas pelayanan.Untuk mengidentifikasi atribut penentu biaya pasien rawat inap, digunakan data kunjungan pasien rawat inap RSUP Dr. Cipto Mangunkusumo dengan jaminan Jamkesmasperiode 1 Januari 2009 s/d 30 September 2010 dari database SIMRS sebanyak 2022 kunjungan (jumlah sebelum dilakukandata cleaning8383). Dengan teknik analisa Atttibute Importance (AI) didapatkan atribut-atribut penentu biaya dengan urutan sebagai berikut: prosedur medis 1 (AI=0,16), prosedur medis 4 (AI=0,15), prosedur medis 3 (AI=0,14), LOS(AI=0,13), prosedur medis 2 (AI=0,13), organisasi (AI=0.10), diagnosa utama (AI=0,08),jenis kelamin (AI=0.02) dan status kawin (AI=0.01). Hasil klasifikasi dengan teknik Algoritma Naive Bayes menunjukkan model yang dibuat memiliki predictive confidencesebesar 50,41%.
Reference:
https://www.kajianpustaka.com/2017/09/data-mining.html
https://docplayer.info/45386521-Contoh-kasus-data-mining.html