THE ROI OF DATA MODELING
DEFINISI DASAR
Istilah “model data” menyiratkan tiga komponen:
- Diagram model dengan entitas, atribut, hubungan dan kunci yang ditunjukkan melalui kotak dan jalurnya, dll.
- Definisi semua objek model data (metadata), terutama definisi dari: entitas, atribut, pengenal dan peran hubungan.
- Aturan bisnis tambahan. Ini adalah kendala yang tidak dapat diwakili dalam struktur model.
Misalnya, model data dapat menunjukkan bahwa Pelanggan dapat memiliki PO namun PO harus dimiliki oleh pelanggan. Namun, tidak mungkin dalam model data bahwa Pesanan Pembelian harus diberikan kepada vendor dengan harga penawaran terendah; ini adalah aturan non-struktural. Tiga karakteristik utama pemodelan data adalah:
- Incremental, karena model data dibuat berkeping-keping. Model data dibagi menjadi area subjek atau partisi sehingga memungkinkan dibuat dalam bentuk potongan.
- Iteratif, karena model data tidak dilakukan secara sekuensial. Ini ditinjau ulang dan kadang-kadang dipikirkan ulang berkali-kali.
- Kolaborasi. Karena model data adalah produk dari beberapa sudut pandang, input ke model data adalah usaha kooperatif yang melibatkan pelaku bisnis dan pakar materi pelajaran lainnya, profesional data, dan administrator database.
Model data dibuat oleh satu orang (atau beberapa pikiran yang sangat kongruen) namun partisipasi banyak orang diperlukan untuk berkontribusi terhadapnya. Model data harus selaras dengan model data lain dalam organisasi.
TINGKAT PEMODELAN DATA
Pemodelan data harus dilakukan dalam tiga tingkatan.
1 Konseptual. Berisi entitas bisnis utama, atribut utama dan hubungan bisnis. Model ini digunakan sebagai alat perencanaan pada tingkat bisnis atau model data proyek awal.
2 Logis Berisi semua entitas data, semua atribut dan semua hubungan data. Model yang lengkap akurat dan rinci, dan mengidentifikasi semua data yang dibutuhkan. Model yang bagus menawarkan sejumlah pilihan untuk implementasi fisik.
3 Fisik. Berisi nama tabel, kolom, indeks, dan batasan serta partisi. Ini adalah model implementasi, menargetkan jenis DBMS dan DBMS fisik tertentu, seperti DB2, Oracle, MongoDB, Hadoop, SQL Server, dll.
Pemodelan data bersifat khusus karena data bersifat khusus dan memiliki konsekuensi yang lebih dalam daripada kode. Data adalah aset perusahaan dan dapat digunakan kembali, bukan hanya aset aplikasi atau program, dan ini mempengaruhi setiap aplikasi (dan komponen aplikasi) yang menggunakannya.
MEMBUAT LINGKUP PROYEK PEMODELAN DATA
Untuk mengukur ROI, dan sebenarnya memiliki proyek yang sukses, pemodelan data harus dibuat lingkup secara berarti. Ini berarti bahwa proyek, bukan hanya aktivitas pemodelan data di dalamnya, harus dibuat lingkup bermakna. Lingkup umumnya harus dinyatakan dalam istilah fungsi atau proses. Sebagai contoh, tidak cukup untuk mengatakan bahwa proyek ini berkaitan dengan “data pelanggan”. Itu terlalu ambigu untuk sebuah ruang lingkup. Sebuah proyek yang berhubungan dengan “kredit pelanggan” lebih nyata.
Lima panduan sederhana membantu mengatur lingkup proyek:
- Sebuah proyek harus dibagi secara bertahap.
- Peningkatan tersebut harus singkat dan mudah diatur secara luas dan mendalam.
- Setiap proyek harus menyediakan pengiriman dini prototipe untuk pengujian dan verifikasi.
- Meskipun model data akhir harus menjadi tanggung jawab pemodel data tunggal (atau beberapa pikiran kongruen), tim lintas fungsi yang menyediakan kolaborasi antar anggota tim untuk identifikasi elemen data sangat penting.
- Pekerjaan harus di-time-box.
Sumber : TOM HAUGHEY, INFOMODEL, LLC