School of Information Systems

DECISION TREE ALGORITMA BESERTA CONTOHNYA PADA DATA MINING

Decision Tree merupakan salah satu cara data processing dalam memprediksi masa depan dengan cara membangun klasifikasi atau regresi model dalam bentuk struktur pohon. Hal tersebut dilakukan dengan cara memecah terus ke dalam himpunan bagian yang lebih kecil lalu pada saat itu juga sebuah pohon keputusan secara bertahap dikembangkan. Hasil akhir dari proses tersebut adalah pohon dengan node keputusan dan node daun. Sebuah node keputusan (misalnya, Cuaca/ Outlook) memiliki dua atau lebih cabang (misalnya, Panas, Berawan dan Hujan).

Decision Tree juga berguna untuk dieksplorasi data, menemukan hubungan antara sejumlah calon variabel input dengan sebuah variabel target. Pohon keputusan eksplorasi data dan pemodelan yang salah langkah pertama yang sangat baik dalam proses pemodelan yang digunakan sebagai model akhir untuk beberapa teknik lainnya.

Kelebihan lain dari metode ini adalah mampu mengeliminasi perhitungan atau data-data yang tidak diperlukan. Karena sampel yang ada biasanya hanya diuji berdasarkan kriteria atau kelas tertentu.

Meski memiliki banyak kelebihan, namun bukan berarti ini tidak memiliki kekurangan. Pohon keputusan ini mungkin tumpang tindih, terutama jika kelas dan kriteria yang digunakan sangat sering dapat meningkatkan waktu pengambilan keputusan sesuai dengan kapasitas memori yang diperlukan.

Algoritme adalah urutan langkah logis yang digunakan untuk memecahkan masalah. Singkatnya, masalah harus terdiri dari beberapa langkah logis

Fungsi pembuatan algoritma digunakan dalam pemecahan masalah pemrograman yang kompleks. Algoritma dapat menyelesaikan program sederhana dan kompleks. Keuntungan lain menggunakan algoritme adalah algoritme dapat digunakan berulang kali. Algoritma juga membuat program menulis lebih sederhana bagi pemrogram. Anda dapat menggunakan algoritme untuk mengimplementasikan strategi top-down dan divide-and-conquer.

Selain itu, algoritma tersebut dapat digunakan untuk mengurangi kesalahan pada program yang berulang. Algoritma sering digunakan sedemikian rupa sehingga masalah dapat diselesaikan secara logis dan berurutan. Dengan menggunakan algoritma yang tepat, program yang ada pun akan rapi, teratur, dan mudah dibuat. Jika terjadi kesalahan, Anda dapat segera menemukannya.

Ini adalah sebuah contoh decision tree pada algoritma

Kondisi berikut harus dipenuhi untuk memutuskan apakah akan bermain tenis atau tidak:

-Climate

-Wind

-Kelembaban

-Temperatur udara

Solusi data per objek data, yang dikenal dengan atribut tujuan, merupakan salah satu atribut -> misalnya atribut “play” dengan nilai “key” atau “not playing” adalah salah satu atributnya.

“Contoh” adalah arti dari atribut.

Asumsikan atribut “Weather” memiliki tiga kemungkinan nilai: cerah, bersalju, dan hujan.

Berdasarkan informasi pada tabel di atas, akan dibuat tabel keputusan untuk memutuskan bermain tenis berdasarkan ramalan cuaca, suhu, kelembaban, dan kondisi angin.

Algoritma secara umum:

-Buat Cabang untuk setiap nilai -Pilih atribut sebagai root

-Ulangi prosedur untuk setiap cabang sampai semua kasus di cabang memiliki kelas yang sama.

-Memilih atribut berdasarkan nilai “gain” tertinggi dari atribut-atribut yang ada.

 

Perhitungan Gain

Keterangan:

  • S : himpunan
  • A : atribut
  • n : jumlah partisi atribut A
  • | Si | : jumlah kasus pada partisi ke-i
  • | S | : jumlah kasus dalam S

 

Menghitung Nilai Entropy

Keterangan:

S : himpunan kasus

A : fitur

n : jumlah partisi S

pi : proporsi dari Si terhadap S

 

 

 

Perincian algoritme (langkah 1)

Hitung jumlah total kasus dan jumlah keputusan “Ya” atau “Tidak”.

Menggunakan atribut “Outlook”, “Temperature”, “Humidity”, dan “Windy”, ukur entropi semua instance yang terbagi.

Hitung perolehan untuk setiap atribut secara terpisah.

 

Perhitungan

 

Perhitungan total entropy

 

Menghitung gain pada baris Outlook

Hitung penguatan untuk suhu, kelembapan, dan kondisi berangin.

 

Kelembaban -> 0,37 ditemukan sebagai atribut dengan Gain tertinggi, seperti yang ditunjukkan pada tabel.

Kelembaban kemudian menjadi simpul akar.

Kelembaban dibagi menjadi dua kategori: “Tinggi” dan “Normal”.

Kelembaban -> “Alami” telah mengategorikan kasus ke dalam salah satu dari dua kategori: ya atau tidak.

Untuk humidity -> “High” msh perlu dilakukan perhitungn lagi (karena masih terdapat “yes” dan “no”)

Pohon keputusan Node 1

 

 

https://danymochtars.wordpress.com/2017/03/07/data-mining-decision-tree/#:~:text=Decision%20Tree%20atau%20Pohon%20Keputusan,model%20dalam%20bentuk %20struktur%20pohon.&text=Hasil%20akhir%20dari%20proses%20tersebut,node%20keputusa n%20dan%20node%20daun.

 

https://bootup.ai/blog/apa-itu-algoritma-pengertian-sejarah-dan-contohnya/ https://www.ilmuskripsi.com/2016/05/contoh-perhitungan-decision-tree-dengan.html

 

Ardi Satyo Ramadhan