School of Information Systems

Langkah-langkah Utama Data Preprocessing

https://images.app.goo.gl/a2ciG6TRxKPUFgru6

Data preprocessing merupakan teknik yang diterapkan pada database untuk menghapus noise, missing value, error, data yang tidak penting dan data yang tidak konsisten. Tujuan dari data preprocessing yaitu untuk mentranformasikan data mentah untuk dianalisis agar dapat menghasilkan data yang berkualitas dan akurat. Biasanya dalam data realtime database seringkali tidak lengkap dan tidak konsisten sehingga hasil data mining tidak berkualitas dan kurang akurat. Oleh karena itu, untuk meningkatkan kualitas data yang akan dianalisis perlu dilakukan langkah-langkah preprocessing data. Langkah-langkah tersebut tidak harus semuanya dilakukan.

Berikut langkah-langkah utama dari data preprocessing :

  1. Data Cleaning

Data Cleaning berfungsi untuk mengganti missing value, menormalkan data yang bermasalah (Noisy), mengindentifikasi dan menghilangkan data yang tidak konsisten dan data yang berulang (Redundancy) yang didapat dari integrasi data, dan menyelesaikan masalah inconsistensi data. Oleh karena itu perlu adanya proses pembersihan data atau biasa dikenal dengan data cleaning.

  1. Data Integration

Data Integration berfungsi untuk mengabungkan beberapa database dan file menjadi 1 sehingga menghasilkan sumber data yang besar.

  1. Data Transformation

Data Tranformation Berfungsi untuk menormalisasikan data dan aggresi data. Data transformation biasanya digunakan untuk mengubah data dalam bentuk yang sesuai dalam proses data mining.

  1. Data Reduction

Data Reduction berfungsi untuk mengurangi volume data yang berlebihan tetapi tetap mempertahankan kualitas dari hasil analisis data. Oleh karena itu, perlu adanya teknik data reduction dengan tujuan untuk meningkatkan efisiensi penyimpanan serta mengurangi biaya penyimpanan dan analisis data.

  1. Data Discretization

Data Discretization berfungsi sebagai bagian dari data reduction dengan memperhitungkan data yang signifikan (Data Numeric).

Referensi :

https://www.dqlab.id/langkah-awal-dalam-pemrosesan-data-dalam-data-mining

https://medium.com/warung-pintar/beberapa-cara-untuk-preprocessing-data-dalam-machine-learning-13cef4294614

Fifi Sarasevia