School of Information Systems

WEKA, Software untuk Knowledge Analysis

Selain dengan menggunakan RapidMiner Studio atau Altair AI Studio, terdapat software lain yang dapat dengan mudah digunakan untuk knowledge analysis yaitu Wakaito Environment for Knowledge Analysis (WEKA). WEKA merupakan perangkat lunak open-source yang digunakan untuk machine learning dan data mining. Dikembangkan oleh Universitas Waikato di Selandia Baru, WEKA menyediakan berbagai algoritma untuk analisis data, termasuk classification, regression, clustering, dan feature selection.

Saat ini WEKA tersedia dalam 2 versi yaitu WEKA 3.8 dan WEKA 3.9. WEKA 3.8 merupakan versi yang lebih stabil. Sebelum meng-install WEKA diperlukan OpenJDK Java VM 17. WEKA dapat di-download pada link berikut https://waikato.github.io/weka-wiki/downloading_weka/.

WEKA mendukung antarmuka grafis (GUI) yang memudahkan pengguna tanpa latar belakang pemrograman untuk melakukan eksperimen dengan data. Selain itu, WEKA mendukung pengolahan data, visualisasi, dan integrasi dengan berbagai format data, sehingga sangat cocok untuk penelitian dan pendidikan di bidang data science dan machine learning. Berikut merupakan tampilan dari GUI WEKA

WEKA memiliki beberapa fitur yang dapat digunakan untuk menunjang pekerjaan data scientist> Fitur-fitur tersebut diantaranya:

1. Exploratory dan Pre-processing Data

WEKA menyediakan alat-alat untuk eksplorasi data misalnya visualisasi data, statistik deskriptif, dan pre-processing data. Berikut merupakan pilihan untuk pre-processing data.

2. Machine Learning Model

WEKA menyediakan banyak pilihan model Machine Learning diantaranya Classification, Clustering, Associate Rule, Selection Attributes dan visualization. Selain itu algoritma

yang tesedia juga banyak dan terdapat referensi jurnal pendukung untuk mempelajari algoritmanya.

3. Evaluation Model

WEKA dapat memberikan informasi tentang dataset yang digunakan. Berikut merupakan hasil tampilan informasi dataset

Selain itu, WEKA juga akan memberikan hasil evaluasi model yang dipilih dengan lengkap mulai dari accuracy, precision, recall, f-measure atau f1-score, dan ROC Area.

Selain itu, WEKA juga akan menampilkan confusion matrix dari model yang dihasilkan.

4. Data Validation

WEKA menyediakan Data Validation mulai dari Split test sampai dengan Cross Validation. Cross Validation dapat dipilih untuk menghindari over-fitting model.

Selain itu, WEKA dapat dijadikan sebagai alat untuk pembelajaran dan penelitian yang sangat mudah dikarenakan WEKA memiliki dokumentasi dan penjelasan yang informatif. Misalkan, WEKA menyediakan informasi dan sumber jurnal yang dapat digunakan untuk menambah informasi. Berikut salah satu contoh dari informasi algoritma Naïve Bayes yang digunakan untuk Classification.

Referensi:

https://dqlab.id/mengenal-weka-tools-open-source-data-scientist https://socs.binus.ac.id/2018/11/29/weka-software-untuk-memahami-konsep-data-mining/

Yulia Ery Kurniawati