Accuracy Estimation Menggunakan Confusion Matrix
Accuracy Estimation Menggunakan Confusion Matrix merupakan salah satu metode Data Mining berupa Prediksi tipe Klasifikasi yang juga merupakan metode supervised learning, dimana terdapat label yang dapat dijadikan acuan dalam mengukur perfomansi sebuah model dan mewakili jumlah dari nilai yang diprediksi dan nilai aktual. Selain itu, Confusion Matrix merupakan bagian dari keluarga Machine Learning yang mempelajari data yang sudah tersedia dan mengklasifikasikan sebagai data baru serta menghasilkan output variabel bersifat kategorial (Nominal atau Ordinal).
Metode Penilaian untuk Klasifikasi antara lain:
Faktor Penilaian | Penjelasan |
Kecepatan | Biaya Komputasi yang terlibat dalam proses |
menghasilkan dan menggunakan model, | |
dimana apabila lebih cepat maka dianggap | |
lebih baik. | |
Kekokohan | Kemampuan Model untuk membuat atau |
menghasilkan prediksi yang cukup akurat | |
Skalabilitas | Kemampuan untuk membangun model |
prediksi secara efisien dengan jumlah data | |
yang cukup besar | |
Interpretabilitas | Tingkat pemahaman dan wawasan yang |
diberikan oleh model |
Di dalam Confusion Matrix, terdapat empat istilah yang digunakan sebagai representasi hasil proses klasifikasi , yaitu True Positive (TP), True Negative (TN), False Positive (FP) dan False Negative (FN).
Confusion Matrix sederhana untuk Tabulasi Hasil Klasifikasi Dua Kelas.
Dengan keterangan sebagai berikut:
Representasi | Penjelasan |
TP (True Positive) | Jumlah Nilai True diklasifikasikan dengan |
akurat | |
TN (True Negative) | Jumlah Nilai False diklasifikasikan secara |
akurat | |
FP (False Positive) | Jumlah Nilai False diklasifikasikan sebagai |
True | |
FN (False Negative) | Jumlah Nilai True diklasifikasikan sebagai |
False |
Contoh:
Disini pada contoh kasus yang akan di pakai adalah sistem pengecekan penyakit kanker pada manusia. Dalam kasus ini terdapat 2 kemungkinan yang terjadi yaitu terdeteksi nya kanker dan juga tidak terdeteksi / sehat. Pertama yang kita harus lakukan adalah menklasifikasikan kelas positive dan negative. Dalam kasus ini maka pembagian akan seperti:
Positive: Kanker Terdeteksi.
Negative: Kanker tidak terdeteksi / Sehat.
True Positive | False Positive |
Dalam kondisi true positive hal yang akan | Dalam kondisi false positive hal yang akan |
terjadi adalah | terjadi adalah |
Sistem pendeteksi: Terdeteksi kanker | Sistem pendeteksi: Terdeteksi kanker |
Kenyataan: Kanker memang hadir dalam | Kenyataan: Tidak ada kanker yang hadir |
pasien | dalam pasien |
False Negative | True Negative |
Dalam kondisi false negative yang akan | Dalam kondisi true negative yang akan |
terjadi adalah | terjadi adalah |
Sistem pendeteksi: Tidak terdeteksi kanker | Sistem pendeteksi: Tidak terdeteksi kanker |
Kenyataan: Kanker memang hadir dalam | Kenyataan: Tidak ada kanker yang hadir |
pasien | dalam pasien |
Dari tabel penjelasan contoh kasus dapat disimpulkan bahwa True positive dan True negative akan memiliki dampak baik untuk pasien karena sistem akan memberikan informasi yang penting dan akurat. Namun sebaliknya dalam kondisi false positive akan terjadi kerugian yang lumayan terhadap pasien. Dan yang paling bahaya adalah false negative dimana ini memberikan dampak buruk terbesar pada pasien karena ada-nya kanker yang tidak terdeteksi.
Referensi:
Ramesh Sharda; Dursun Delen; Efraim Turban. (2021).Analytics, Data Science, & Artificial Intelligence Systems for Decision Support, Global Edition. 11 th Edition.Pearson (Intl). Harlow.
https://www.sciencedirect.com/topics/engineering/confusion-matrix
https://developers.google.com/machine-learning/crash-course/classification/true-false-positive-negative