Masalah yang ditimbulkan oleh data redundancy (pengulangan data yang sama di banyak tempat) bukan hanya membuat ukuran database atau file menjadi lebih besar, tetapi juga dapat menimbulkan berbagai kesalahan logika yang serius dalam pengelolaan data. Dalam dataset besar, terutama yang digunakan untuk analisis seperti di Power Pivot atau sistem database lainnya, redundansi dapat menyebabkan tiga jenis masalah utama, yaitu insertion anomalydeletion anomaly, dan modification anomaly. Ketiga masalah ini muncul karena struktur data tidak diorganisasi secara efisien, sehingga informasi yang seharusnya disimpan satu kali justru diulang-ulang di banyak baris atau kolom. 

 

Masalah pertama adalah insertion anomaly atau anomali saat penambahan data. Anomali ini terjadi ketika kita tidak bisa menambahkan satu data baru tanpa harus ikut memasukkan data lain yang sebenarnya tidak diperlukan. Hal ini sering terjadi jika berbagai jenis informasi dicampur dalam satu tabel yang sama. Misalnya, dalam database pesanan pelanggan, data pelanggan (nama, alamat, nomor telepon) disimpan dalam tabel yang sama dengan data pesanan (nomor order, produk, jumlah pembelian). Ketika pelanggan lama melakukan pembelian baru, semua detail pelanggan harus diketik ulang bersama data pesanan tersebut, meskipun informasinya sama seperti sebelumnya. Ini menyebabkan pengulangan data yang tidak perlu, memperbesar ukuran database, dan meningkatkan risiko kesalahan input. Padahal, secara logis kita hanya perlu mencatat bahwa pelanggan dengan ID tertentu melakukan pesanan sejumlah tertentu. Detail pelanggan seharusnya cukup disimpan satu kali dalam tabel khusus pelanggan. Dengan struktur seperti ini, penambahan order baru tidak lagi membutuhkan pengulangan data pelanggan. Insertion anomaly menunjukkan bahwa desain tabel yang buruk dapat memaksa kita memasukkan data tambahan yang sebenarnya tidak relevan dengan transaksi yang sedang dicatat. 

Masalah kedua adalah deletion anomaly atau anomali saat penghapusan data.Ini terjadi ketika menghapus satu data justru menyebabkan hilangnya data lain yang masih dibutuhkan. Contohnya, sebuah tabel menyimpan nama pelanggan dan nomor order dalam satu baris. Jika seorang pelanggan membatalkan pesanannya dan baris tersebut dihapus, maka nama pelanggan juga ikut terhapus dari database. Jika itu adalah satu-satunya order yang pernah dia buat, sistem seolah-olah “melupakan” bahwa orang tersebut adalah pelanggan. Padahal, statusnya sebagai pelanggan tetap valid meskipun tidak memiliki order aktif. Contoh lain bisa dilihat pada data mahasiswa dan mata kuliah dalam satu tabel. Jika mahasiswa berhenti dari satu mata kuliah dan baris tersebut dihapus, sementara itu satu-satunya mata kuliah yang diambil, maka data mahasiswa ikut hilang dari sistem, seolah-olah ia bukan mahasiswa lagi. Masalah ini terjadi karena data entitas utama (pelanggan atau mahasiswa) digabung dengan data aktivitasnya (order atau mata kuliah) dalam satu tabel. Jika data tersebut dipisah ke tabel berbeda—misalnya tabel pelanggan terpisah dari tabel order—maka penghapusan order tidak akan memengaruhi data pelanggan. Deletion anomaly menunjukkan bagaimana desain tabel yang tidak efisien dapat menyebabkan kehilangan informasi penting secara tidak sengaja. 

 Masalah ketiga adalah modification anomaly atau anomali saat perubahan data. Anomali ini muncul ketika satu jenis informasi yang sama tersimpan di banyak tempat, sehingga jika ada perubahan, semua salinan tersebut harus diperbarui secara konsisten. Jika ada satu saja yang terlewat, maka data menjadi tidak konsisten. Misalnya, dalam data penjualan, nama produk ditulis lengkap di setiap baris transaksi. Jika ada kesalahan ejaan atau perubahan nama produk, maka semua baris yang memuat nama tersebut harus diperbarui satu per satu. Jika ada perbedaan penulisan di beberapa baris, sistem bisa menganggapnya sebagai produk yang berbeda, sehingga laporan penjualan menjadi tidak akurat. Contoh lain adalah perubahan nama pemasok (supplier). Jika nama supplier tersimpan di banyak baris produk, maka perubahan harus dilakukan di semua baris tersebut. Risiko kesalahan sangat tinggi. Masalah ini bisa dihindari jika nama produk atau supplier hanya disimpan sekali dalam tabel khusus (tabel produk atau tabel supplier), sedangkan tabel transaksi hanya menyimpan ID-nya. Dengan cara ini, perubahan cukup dilakukan di satu tempat saja.

Ketiga jenis anomali ini menunjukkan bahwa redundansi data menyebabkan pemborosan penyimpanan, meningkatkan peluang kesalahan, merusak konsistensi data, dan mempersulit analisis. Data yang tidak konsisten dapat menghasilkan laporan yang salah dan keputusan bisnis yang keliru. Selain itu, dalam konteks Power Pivot, tabel yang penuh pengulangan teks akan memperberat model data dan menurunkan performa perhitungan. 

Solusi utama untuk mengatasi masalah ini adalah normalisasi data, yaitu proses mengatur data ke dalam beberapa tabel berdasarkan jenis informasinya dan menghubungkannya menggunakan ID atau relasi, bukan dengan mengulang data teks yang sama. Dengan normalisasi, setiap data unik disimpan satu kali saja, sementara tabel lain cukup merujuknya melalui kunci (key). Struktur seperti ini membuat database lebih ringan, lebih konsisten, dan lebih mudah dikelola. Selain meningkatkan performa sistem, normalisasi juga menjaga integritas data sehingga analisis yang dihasilkan lebih akurat dan dapat dipercaya. 

 Reference:
Bernard Obeng Boateng. (2023). Data Modeling with Microsoft Excel. 1st. Packt. Birmingham. ISBN: 971803240282.