Mengenal dan Mendalami Amazon Redshift
Amazon Redshift merupakan produk dari AWS (Amazon Web Services) yang termanajemen penuh dan dapat menskalakan gudang data hingga ukuran petabyte pada suatu Cloud. Dengan Amazon Redshift pengguna dapat memanfaatkan data yang ada untuk mendapatkan suatu pemahaman baru mengenai informasi bisnis ataupun pelanggan. Pengguna Amazon Redshift dapat memulai dengan ratusan gigabyte data kemudian menskalakan data tersebut hingga petabyte atau lebih lagi.
Hal pertama yang dapat dilakukan untuk membentuk suatu gudang data pada Amazon Redshift adalah dengan meluncurkan suatu set node yang mana node tersebut dinamai dengan Amazon Redshift Cluster. Setelah cluster terbentuk, pengguna dapat mengunggah data-data yang ada kemudian membentuk suatu kueri analisis data. Amazon Redshift memiliki performa kueri yang cepat meskipun menggunakan basis tools SQL dan aplikasi Business Intelligence jenis apapun. Sehingga jika dirangkum maka layanan yang diberikan oleh Amazon Redshift adalah seputar manajemen pekerjaan perusahaan dari mulai pengaturan, operasi, dan penskalaan gudang data. Tugas-tugas tersebut termasuk dalam penyediaan kapasitas, pemantauan, mencadangkan cluster, serta meningkatkan performa kerja mesin Amazon Redshift sendiri.
Amazon Redshift Cluster terdiri dari kumpulan node yang mana dari kumpulan tersebut terdapat satu node yang menjadi kepala node. Sejumlah node yang dibutuhkan tersebut tipe dan besarnya bergantung kepada ukuran dari data yang ada, jumlah kueri yang akan dijalankan, serta performansi eksekusi kueri yang dibutuhkan. Sedangkan dalam hal membuat dan mengelola suatu cluster akan bergantung kepada gudang data yang dibutuhkan. Pengguna dapat memulai dari ukuran data yang lebih kecil dan cluster node tunggal yang akan di perbesar nantinya. Pengguna juga memiliki hak untuk menambah atau mengurangi node ke dalam cluster tanpa adanya gangguan pada layanan. Secara garis besar, benefit yang didapatkan pengguna Amazon Redshift adalah sebagai berikut:
- Bekerja cepat. Dalam hal optimalisasi dalam hal gudang data, Amazon Redshift menggunakan berbagai variasi inovasi untuk menghasilkan performansi kueri yang tinggi pada kumpulan data yang beragam dari segi ukuran gigabyte hingga petabyte. Inovasi ini terdapat pada penggunaan penyimpanan columnar, data kompresi, dan zona peta untuk menurunkan jumlah I/O yang dibutuhkan untuk menampilkan kueri. Amazon Redshift juga bersifat terukur, hanya dengan beberapa saat setelah mengeklik Amazon Web Service Management maka jumlah atau tipe node pada gudang data Cloud dapat berubah sejalan dengan perubahan pada performansi dan kebutuhan kapasitas.
- Murah. Hal ini karena Amazon Redshift tidak membutuhkan biaya pembayaran di awal. Pengguna hanya perlu membayarkan biaya untuk sumber daya yang disediakan oleh layanan AWS. Sehingga pembayarannya hanya bersifat saat dibutuhkan tanpa ada pembayaran awal atau komitmen jangka panjang.
- Fitur cadangan otomatis. Amazon Redshift memiliki fitur snapshot secara otomatis yang akan bekerja secara terus menerus untuk mencadangkan data pada suatu cluster kepada Amazon S3. Amazon Redshift akan menyimpan snapshot tersebut untuk pengguna dalam jangka waktu yang ditentukan sendiri oleh pengguna. Fitur Snapshot dapat dilakukan oleh pengguna kapan saja dan hasil pencadangan dapat dipertahankan maupun dihapuskan secara eksplisit.
Sumber :
AWS. 2018. Amazon Redshift : cluster management guide. Whitepaper Officially website of AWS. https://www.amazonaws.cn/en/redshift/ Diakses 3 Juli 2021