Tren Data Besar Dan Analisis Tepat Untuk 2021
Mobil self-driving, robot manusia hidup, dan drone pengiriman otonom adalah wajah seksi dan menarik dari transformasi digital yang kita lihat di sekitar kita hari ini.
Namun, semua ini tidak akan mungkin, tanpa data – minyak dari revolusi industri keempat – dan teknologi analitik yang kami bangun untuk memungkinkan kami menafsirkan dan memahaminya.
Big Data adalah istilah yang kemudian digunakan untuk menggambarkan teknologi dan praktik bekerja dengan data yang tidak hanya dalam volume besar tetapi juga cepat dan hadir dalam berbagai bentuk. Untuk setiap Elon Musk dengan mobil self-driving untuk dijual, atau Jeff Bezos dengan toko serba ada tanpa kasir, ada operasi Big Data yang canggih dan pasukan ilmuwan data pintar yang telah mengubah visi menjadi kenyataan.
Istilah Big Data itu sendiri mungkin tidak ada di mana-mana seperti beberapa tahun yang lalu, dan itu murni karena banyak konsep yang diwujudkannya telah tertanam secara menyeluruh ke dunia di sekitar kita. Tetapi hanya karena kita telah mendengarnya untuk sementara waktu, bukan berarti itu berita lama. Faktanya adalah bahwa bahkan saat ini, sebagian besar organisasi berjuang untuk mendapatkan nilai dari banyak data yang mereka akses. Sebagai praktik bisnis, ini masih sangat baru.
Jadi, inilah pandangan saya tentang beberapa tren utama yang akan memengaruhi bagaimana data dan analitik digunakan untuk bekerja, bermain, dan segala sesuatu di antaranya, tahun ini dan dalam waktu dekat.
AI mendorong wawasan yang lebih dalam dan otomatisasi yang semakin canggih
Kecerdasan buatan (AI) telah menjadi gamechanger untuk analitik. Dengan banyaknya data terstruktur dan tidak terstruktur yang dihasilkan oleh perusahaan dan pelanggan mereka, bahkan bentuk analitik manual otomatis hanya dapat menggores permukaan dari apa yang dapat ditemukan.
Cara paling sederhana untuk memikirkan AI, seperti yang digunakan saat ini, adalah mesin – komputer dan perangkat lunak – yang mampu belajar sendiri. Sebagai contoh sederhana, mari kita lihat masalah yang mungkin kita gunakan untuk menyelesaikannya dengan komputer hari ini. Manakah dari pelanggan kami yang paling berharga bagi kami?
Jika kami hanya memiliki komputasi non-pembelajaran tradisional yang tersedia untuk kami, kami mungkin dapat mencoba dengan membuat database yang menunjukkan kepada kami pelanggan mana yang menghabiskan uang paling banyak. Tetapi bagaimana jika muncul pelanggan baru yang menghabiskan $100 dalam transaksi pertama mereka dengan kami? Apakah mereka lebih berharga daripada pelanggan yang menghabiskan $10 sebulan selama setahun terakhir? Untuk memahami bahwa kita membutuhkan lebih banyak data, seperti rata-rata nilai seumur hidup pelanggan, dan mungkin data pribadi tentang pelanggan itu sendiri seperti usia, kebiasaan belanja, atau tingkat pendapatan juga akan berguna!
Menafsirkan, memahami, dan menarik wawasan dari semua kumpulan data tersebut adalah tugas yang jauh lebih rumit. AI berguna di sini karena ia dapat mencoba untuk menafsirkan semua data bersama-sama dan menghasilkan prediksi tentang apa nilai seumur hidup potensial pelanggan mungkin didasarkan pada semua yang kita ketahui – apakah kita memahami koneksi itu sendiri atau tidak. Elemen penting dari hal ini adalah bahwa hal itu tidak selalu menghasilkan jawaban “benar” atau “salah” – ini memberikan berbagai probabilitas dan kemudian menyaring hasilnya tergantung pada seberapa akurat prediksi tersebut.
Beragam cara baru untuk menjelajahi dan menafsirkan data
Visualisasi data adalah “langkah terakhir” dari proses analitik sebelum kami mengambil tindakan berdasarkan temuan kami. Secara tradisional, komunikasi antara mesin dan manusia dilakukan dengan visualisasi, dalam bentuk grafik, bagan, dan dasbor yang menyoroti temuan utama dan membantu kita menentukan apa yang disarankan data untuk dilakukan.
Masalahnya di sini adalah tidak semua orang hebat dalam menemukan wawasan berharga yang berpotensi tersembunyi di tumpukan statistik. Karena menjadi semakin penting bahwa setiap orang dalam suatu organisasi diberdayakan untuk bertindak berdasarkan wawasan berbasis data, cara-cara baru untuk mengkomunikasikan temuan ini terus berkembang.
Salah satu bidang di mana terobosan penting telah dibuat adalah penggunaan bahasa manusia. Alat analitik yang memungkinkan kami mengajukan pertanyaan tentang data dan menerima jawaban dengan bahasa manusia yang jelas akan sangat meningkatkan akses ke data dan meningkatkan kemampuan data secara keseluruhan dalam organisasi. Bidang teknologi ini dikenal sebagai pemrosesan bahasa alami (NLP).
Lain adalah teknologi baru yang memungkinkan kita untuk mendapatkan gambaran visual yang lebih baik dan pemahaman data dengan sepenuhnya membenamkan diri di dalamnya. Extended reality (XR) – istilah yang mencakup virtual reality (VR) dan augmented reality (AR) jelas akan terlihat mendorong inovasi di sini. VR dapat digunakan untuk membuat jenis visualisasi baru yang memungkinkan kita untuk memberikan makna yang lebih kaya dari data, sementara AR dapat menunjukkan kepada kita secara langsung bagaimana hasil analisis data berdampak pada dunia secara real-time. Misalnya, seorang mekanik yang mencoba mendiagnosis masalah pada mobil mungkin dapat melihat mesin yang memakai kacamata AR dan diberi prediksi tentang komponen apa yang mungkin bermasalah dan mungkin perlu diganti. Dalam waktu dekat, kita akan melihat cara baru untuk memvisualisasikan atau mengomunikasikan data, memperluas aksesibilitas ke analitik dan wawasan.
Awan hibrida dan tepiannya
Komputasi awan adalah tren teknologi lain yang memiliki dampak besar pada cara analitik Big Data dilakukan. Kemampuan untuk mengakses penyimpanan data yang luas dan bertindak berdasarkan informasi waktu nyata tanpa memerlukan infrastruktur lokal yang mahal telah memicu ledakan aplikasi dan perusahaan rintisan yang menawarkan layanan berbasis data sesuai permintaan. Namun mengandalkan sepenuhnya pada penyedia cloud publik bukanlah model terbaik untuk setiap bisnis, dan ketika Anda memercayakan seluruh operasi data Anda kepada pihak ketiga, pasti ada kekhawatiran seputar keamanan dan tata kelola.
Banyak perusahaan sekarang menemukan diri mereka melihat ke arah sistem cloud hybrid, di mana beberapa informasi disimpan di Amazon Web Service, Microsoft Azure, atau server Google Cloud, sementara yang lain, mungkin data yang lebih pribadi atau sensitif, tetap berada di dalam taman bertembok berpemilik. Penyedia cloud semakin siap dengan tren ini, menawarkan solusi “cloud-on-premises” yang berpotensi menyediakan semua fitur yang kaya dan kekokohan cloud publik tetapi memungkinkan pemilik data menyimpan data mereka secara penuh
Komputasi tepi adalah tren kuat lainnya yang akan memengaruhi dampak Big Data dan analitik terhadap kehidupan kita selama tahun depan. Pada dasarnya ini berarti perangkat yang dibuat untuk memproses data di tempat pengumpulannya, daripada mengirimkannya ke cloud untuk penyimpanan dan analisis. Beberapa data hanya perlu ditindaklanjuti terlalu cepat untuk mengambil risiko mengirimnya mundur dan maju – contoh yang baik di sini adalah data yang dikumpulkan dari sensor pada kendaraan otonom. Dalam situasi lain, konsumen dapat diyakinkan bahwa mereka memiliki tingkat privasi tambahan ketika wawasan dapat diperoleh langsung dari perangkat mereka tanpa harus mengirim data ke pihak ketiga mana pun. Misalnya, fitur Now Playing di ponsel Android baru Google terus memindai lingkungan untuk mencari musik sehingga dapat memberi tahu kami nama lagu yang diputar di supermarket atau film yang kami tonton. Ini tidak akan mungkin dilakukan dengan solusi berbasis cloud murni karena pengguna akan menolak gagasan untuk mengirimkan aliran 24/7 yang konstan dari lingkungan audio mereka ke Google.
Munculnya DataOps
DataOps adalah metodologi dan praktik yang meminjam dari kerangka kerja DevOps yang sering digunakan dalam pengembangan perangkat lunak. Sementara mereka yang berada di peran DevOps mengelola proses teknologi yang sedang berlangsung seputar penyampaian layanan, DataOps memperhatikan aliran data ujung ke ujung melalui suatu organisasi. Secara khusus, ini berarti menghilangkan hambatan yang membatasi kegunaan atau aksesibilitas data dan penyebaran alat data “sebagai-layanan” pihak ketiga.
Tidak ada pelatihan formal yang diperlukan untuk bekerja di DataOps. Evolusi peran menjadikannya peluang besar bagi siapa saja yang memiliki pengalaman atau minat dalam karir TI yang ingin mengerjakan proyek paling menarik dan inovatif, yang seringkali merupakan proyek data. Kami juga akan melihat pertumbuhan popularitas vendor “DataOps-as-a-service”, yang menawarkan pengelolaan proses data dan saluran pipa secara menyeluruh dan bayar sesuai penggunaan. Ini akan terus menurunkan hambatan masuk ke organisasi kecil dan pemula dengan ide-ide hebat untuk layanan berbasis data baru tetapi tanpa akses ke infrastruktur yang diperlukan untuk mewujudkannya.