School of Information Systems

Accuracy Estimation Menggunakan Confusion Matrix

Accuracy Estimation Menggunakan Confusion Matrix merupakan salah satu metode Data Mining berupa Prediksi tipe Klasifikasi yang juga merupakan metode supervised learning, dimana terdapat label yang dapat dijadikan acuan dalam mengukur perfomansi sebuah model dan mewakili jumlah dari nilai yang diprediksi dan nilai aktual. Selain itu, Confusion Matrix merupakan bagian dari keluarga Machine Learning yang mempelajari data yang sudah tersedia dan mengklasifikasikan sebagai data baru serta menghasilkan output variabel bersifat kategorial (Nominal atau Ordinal).

Metode Penilaian untuk Klasifikasi antara lain:

Faktor Penilaian Penjelasan
Kecepatan Biaya Komputasi yang terlibat dalam proses
  menghasilkan dan menggunakan model,
  dimana apabila lebih cepat maka dianggap
  lebih baik.
Kekokohan Kemampuan Model untuk membuat atau
  menghasilkan prediksi yang cukup akurat
Skalabilitas Kemampuan untuk membangun model
  prediksi secara efisien dengan jumlah data
  yang cukup besar
Interpretabilitas Tingkat pemahaman dan wawasan yang
  diberikan oleh model

Di dalam Confusion Matrix, terdapat empat istilah yang digunakan sebagai representasi hasil proses klasifikasi , yaitu True Positive (TP), True Negative (TN), False Positive (FP) dan False Negative (FN).

Confusion Matrix sederhana untuk Tabulasi Hasil Klasifikasi Dua Kelas.

Dengan keterangan sebagai berikut:

Representasi Penjelasan
TP (True Positive) Jumlah Nilai True diklasifikasikan dengan
  akurat
TN (True Negative) Jumlah Nilai False diklasifikasikan secara
  akurat
FP (False Positive) Jumlah Nilai False diklasifikasikan sebagai
  True
FN (False Negative) Jumlah Nilai True diklasifikasikan sebagai
  False

Contoh:

Disini pada contoh kasus yang akan di pakai adalah sistem pengecekan penyakit kanker pada manusia. Dalam kasus ini terdapat 2 kemungkinan yang terjadi yaitu terdeteksi nya kanker dan juga tidak terdeteksi / sehat. Pertama yang kita harus lakukan adalah menklasifikasikan kelas positive dan negative. Dalam kasus ini maka pembagian akan seperti:

Positive: Kanker Terdeteksi.

Negative: Kanker tidak terdeteksi / Sehat.

True Positive False Positive
Dalam kondisi true positive hal yang akan Dalam kondisi false positive hal yang akan
terjadi adalah terjadi adalah
Sistem pendeteksi: Terdeteksi kanker Sistem pendeteksi: Terdeteksi kanker
Kenyataan: Kanker memang hadir dalam Kenyataan: Tidak ada kanker yang hadir
pasien dalam pasien

False Negative True Negative
Dalam kondisi false negative yang akan Dalam kondisi true negative yang akan
terjadi adalah terjadi adalah
Sistem pendeteksi: Tidak terdeteksi kanker Sistem pendeteksi: Tidak terdeteksi kanker
Kenyataan: Kanker memang hadir dalam Kenyataan: Tidak ada kanker yang hadir
pasien dalam pasien

Dari tabel penjelasan contoh kasus dapat disimpulkan bahwa True positive dan True negative akan memiliki dampak baik untuk pasien karena sistem akan memberikan informasi yang penting dan akurat. Namun sebaliknya dalam kondisi false positive akan terjadi kerugian yang lumayan terhadap pasien. Dan yang paling bahaya adalah false negative dimana ini memberikan dampak buruk terbesar pada pasien karena ada-nya kanker yang tidak terdeteksi.

Referensi:

Ramesh Sharda; Dursun Delen; Efraim Turban. (2021).Analytics, Data Science, & Artificial Intelligence Systems for Decision Support, Global Edition. 11 th Edition.Pearson (Intl). Harlow.

https://www.sciencedirect.com/topics/engineering/confusion-matrix

https://developers.google.com/machine-learning/crash-course/classification/true-false-positive-negative

Xenia Dharmawan, Edi Purnomo Putra