Dimensi dari Data Quality

Suatu sistem harus dapat menyajikan data dengan kualitasi yang baik, namun karena berbagai jenis data yang sangat variatif dengan kuantitas yang beragam, maka diperlukan acuan yang dapat digunakan untuk mengukur kualitas data. Dimensi dari data quality ini dapat digunakan sebagai acuan untuk mengukur kualitas data yang ada.
Ada 9 dimensi dari kualitas data yang pada umumnya disetujui sebagai indikator yang dapat digunakan untuk mengukur dan mengevaluasi kualitas data, dimensi – dimensi tersebut adalah sebagai berikut:
- Akurasinya (Accuracy), dimensi ini digunakan untuk mengukur sejauh mana data mencerminkan realitas atau kondisi sebenarnya, biasa dapat diukur dengan menggunakan referensi fisik (Physical World Measurement) atau referensi sumber (Reference Source Measurement). Contoh: Data pelanggan harus mencerminkan informasi yang benar seperti nama, alamat, dan nomor telepon. 2
- Kelengkapan (Completeness), digunakan untuk mengukur apakah semua informasi yang diperlukan tersedia. Dapat diukur dengan metode Missing Record Cek, Null Attribute Check, Missing Reference Check dan Data Truncation Check. Masing-masing metode memiliki fungsinya masing masing. Contoh: Jika suatu formulir membutuhkan alamat email dan nomor telepon, data dianggap tidak lengkap jika salah satunya hilang, tidak terisi atau diisi dengan data kosong.
- Konsistensi (Consistency), dimensi ini mengacu pada keselarasan data di seluruh sistem atau database. Konsistensi harus dilakukan dalam berbagai aspek seperti: Konsistensi antara target dan tujuan, konsistensi atribut, konsistensi diantara suatu subjek area, konsistensi pada setiap transaksi dan konsistensi pada setiap rentang waktu. Contoh: Jika nama pelanggan di sistem A adalah “John Doe,” maka di sistem B seharusnya sama, bukan “J. Doe.”
- Relevansi (Relevance) mengukur apakah data sesuai dan berguna untuk tujuan tertentu. Relevansi mengacu pada sejauh mana data memenuhi kebutuhan pengguna atau sesuai dengan tujuan tertentu. Data yang relevan adalah data yang memiliki nilai dan kegunaan dalam konteks penggunaannya, baik itu untuk analisis, pengambilan keputusan, atau pelaksanaan tugas. Data relevansi harus memiliki tujuan yang spesifik, efisien, sesuai konteks. Contoh: Informasi tren belanja pelanggan tahun lalu mungkin kurang relevan untuk menentukan strategi pemasaran saat ini.
- Ketepatan Waktu (Timeliness), mengacu pada apakah data terbaru dan tersedia tepat waktu untuk digunakan, karena pada saat suatu kejadian terjadi di dunia nyata seperti transaksi, sistem biasanya membutuhkan data untuk memproses informasi tersebut, waktu yang dibutuhkan tersebut yang akan menentukan kualitas data dari dimensi timeliness ini. Contoh: Data stok barang harus diperbarui secara real-time untuk menghindari kesalahan pemesanan.
- Keunikan (Uniqueness), dalam data quality merujuk pada sejauh mana data bebas dari duplikasi atau entri yang berulang. Data dianggap unik jika setiap entitas atau objek hanya direpresentasikan sekali dalam dataset, tanpa ada pengulangan atau konflik identitas. Hal ini perlu dievaluasi untuk meningkatkan efisiensi penyimpanan, mencegah adanya kebingungan data dan meningkatkan integritas. Contoh: Tidak boleh ada dua entri yang berbeda untuk satu pelanggan yang sama.
- Validitas (Validity), dalam data quality mengacu pada sejauh mana data memenuhi aturan, format, atau kriteria yang ditetapkan untuk tipe data tertentu. Validitas memastikan bahwa data yang dikumpulkan atau dimasukkan ke dalam sistem sesuai dengan standar yang telah ditentukan dan dapat digunakan untuk analisis yang benar. Data validity dapat diukur dengan beberapa acuan seperti: Rules (aturan), Range of Values (Numeric/Date) dan Sequence of Events. Contoh: Alamat email harus memiliki format valid seperti username@example.com.
- Dapat Diakses (Accessibility), dalam data quality mengacu pada sejauh mana data dapat diakses atau diperoleh oleh pengguna yang berwenang, kapan pun dibutuhkan, dan dalam kondisi yang memungkinkan data digunakan dengan mudah. Aksesibilitas data bukan hanya mengenai kemampuan untuk mendapatkan data, tetapi juga tentang bagaimana data tersebut dapat digunakan secara efisien dan aman. Penilaian dimensi ini mencakup pada pengukuran kemudahan dalam mengakses data tanpa hambatan teknis atau administratif. Contoh: Pengguna yang berwenang harus dapat mengakses data yang mereka perlukan dengan mudah.
- Keandalan (Reliability), dalam data quality mengacu pada sejauh mana data konsisten, stabil, dan dapat dipercaya saat diakses atau digunakan dalam berbagai situasi. Data yang reliabel akan memberikan hasil yang sama setiap kali diakses atau diproses, baik itu oleh individu yang berbeda atau dalam kondisi yang berbeda. Data dengan reliability yang baik harus memiliki konsistensi, stabilitas dan referensi yang jelas dan baik. Contoh: Hasil laporan data harus tetap sama meskipun diakses oleh pengguna yang berbeda.