6 Frontiers for Data Virtualization
Data Virtualization adalah pendekatan manajemen data yang memungkinkan aplikasi untuk mengambil dan memanipulasi data tanpa memerlukan detail teknis tentang data, seperti bagaimana diformat pada sumber, atau di mana lokasinya secara fisik, dan dapat menyediakan satu pelanggan tampilan (atau tampilan tunggal entitas lain) dari keseluruhan data. Terdapat beberapa frontiers untuk Data Virtualization, diantaranya adalah:
Pertama: Streaming Data Virtualization
Hampir setiap perangkat, kendaraan, atau peralatan robotik baru memiliki sensor yang tertanam. Supply chain management ingin mengantisipasi perubahan stream. Semua data bergerak, tetapi data virtualization tools pada generasi pertama dirancang untuk data diam. Persiapan data streaming mengubah data yang bergerak menjadi tabel streaming. Baris dalam tabel diperbarui dengan setiap peristiwa. Alih-alih menghubungkan ke data pada disk, mereka terhubung langsung ke aliran. Kafka, MQTT, data drone, umpan stream, pembacaan sensor IoT. Mereka menyediakan alat untuk membersihkan, mengagregasi, dan menambah acara. Streaming Data Virtualization mengubah tabel langsung menjadi sumber data virtualisasi data. Untuk transformasi digital, mengelola data yang sedang bergerak adalah hal baru yang sangat penting. Streaming Data Virtualization mengubah data yang bergerak menjadi wawasan tervirtualisasi. Ini adalah batas baru pertama untuk virtualisasi data.
Kedua: Virtualized Data Science Model Output
AI dan ilmu data adalah bidang teknologi yang sangat trend. Ilmuwan data melahap data, dan mereka membuat algoritme. Dan algoritme tersebut menghasilkan data turunan yang merepresentasikan prediksi berdasarkan data mentah. Batas baru untuk virtualisasi data adalah memberikan masukan ke dan keluaran dari model tersebut sebagai layanan data, konsisten untuk semua tim, pemangku kepentingan, dan aplikasi yang relevan.
Virtualisasi data mempercepat ilmu data, dengan membuat tampilan yang konsisten dari data yang tersedia bagi tim yang mengevaluasi algoritme untuk mengembangkan model yang akurat dan berguna. Setelah tim ilmuwan data menemukan algoritme yang menjanjikan, selanjutnya opsi baru adalah memuatnya ke dalam alat “operasionalisasi model”, atau Operasi Model. Alat Model Ops mengelola siklus hidup dan penerapan algoritme. Ini seperti garasi parkir untuk algoritma. Seorang ilmuwan data memarkir algoritme yang memprediksi apa yang selanjutnya akan dibeli pelanggan di alat Model Ops. Seorang insinyur data dapat memilih model dari garasi dan menerapkannya ke dalam struktur virtualisasi data. Analis sekarang dapat menanyakan apa yang kemungkinan besar akan dibeli oleh pelanggan pada saat yang sama dengan apa yang telah mereka beli. Ilmu data virtual membantu perusahaan menjadi lebih digerakkan oleh AI. Tim ilmu data mendapatkan data yang lebih baik. Ini meningkatkan kolaborasi tim. Semakin banyak ide yang lebih baik ditemukan. Ini adalah cara inovatif dan lebih baik untuk mengubah matematika menjadi wawasan dan ROI.
Ketiga: Data-as-a-Service (DaaS)
API adalah pipa application-to-application bisnis digital modern. Dalam beberapa kasus, API adalah model bisnis. Tetapi API harus dikelola seperti produk, dan di situlah alat pengelolaan API berperan. “Bisakah seseorang menerapkan API pada data itu?” adalah permintaan umum lainnya yang didapat teknisi data hari ini. Tentu, seseorang dapat menampilkan interface REST pada layanan, tetapi haruskah seseorang melakukannya? Siapa yang menelepon? Berapa kali? Akankah bisnis mengenakan biaya untuk mengakses API? Berapa banyak? DaaS tools memungkinkan seseorang memilih tampilan data yang ingin ditampilkan sebagai API. Management tools API mengelola API tersebut sebagai produk. Mengubah data virtual menjadi layanan adalah batas ketiga dari virtualisasi data.
Keempat: Virtualized Metadata Harvesting
Pada Maret 2020, Panera Bread memutuskan untuk mengubah model bisnis mereka. Mereka mengubah 2.000 restoran dari kafe menjadi pedagang grosir. Sekarang, mereka menjual bahan-bahannya agar pelanggan bisa menyantap makanan berkualitas Panera di rumah. Transformasi bisnis semacam ini membutuhkan metadata atau data. Panera memiliki data tentang datanya di satu tempat. Memiliki akses cepat ke menu, resep, pemasok, dan data inventaris membantu mereka mengubah model bisnis dalam sepuluh hari.
Kelima: Data Virtualization as a Team Sport
Di masa depan, hampir semua pekerja akan menjadi pekerja pengetahuan. Mereka semua membutuhkan data, dan mereka perlu berbagi pandangan data yang sama. Namun tidak setiap pekerja memahami kompleksitas data. “Citizen tools” memudahkan non-insinyur untuk mengelola data. Alat-alat ini adalah perbatasan kelima dari virtualisasi data. Misalnya, 50.000 karyawan Panera berbagi satu tampilan data. Jadi ketika mereka memutuskan untuk menawarkan bahan mereka untuk dijual, semua tim bisa bekerja sebagai satu tim. Ini termasuk:
- E-commerce channel managers
- Menu management
- Point of sale
- Panera’s food innovation team
- The “clean ingredients” team
- Chefs
- Calorie counters
- Supply chain managers
- Food quality assurance
- Consumer and sensory testing
Dan, TI membutuhkan alat yang dirancang untuk mereka. Sebagai contoh:
- Data scientists want to manage data with Jupyter notebooks
- Data engineers need tools to optimize performance
- Automation engineers need real-time tools
Virtualisasi data harus membantu semua persona ini dengan alat yang dirancang untuk mereka.
Keenam: Integrated Data Quality
Kualitas adalah pekerjaan pertama untuk insinyur data. Alat kualitas data membantu membersihkan, menghapus duplikat, dan memvalidasi data. Insinyur data secara wajar mengharapkan kemampuan kualitas data untuk menjadi bagian dari virtualisasi data. Alat kualitas data asli untuk virtualisasi data adalah perbatasan keenam. Dengan alat kualitas data asli, konsumen dapat mempercayai integritas datanya. Wawasan analitis yang dihasilkan akan lebih akurat dan berdampak bagi bisnis.