School of Information Systems

Apa itu TIBCO ComputeDB?

TIBCO ComputeDB ™ (alias SnappyData ™) adalah database analitik terdistribusi yang dioptimalkan dalam memori. TIBCO ComputeDB memberikan throughputtinggi, latensi rendah, dan konkurensi tinggi untuk beban kerja analitik terpadu. Dengan menggabungkan basis data hybrid dalam-memori di dalam Apache Spark, ia menyediakan pemrosesan kueri analitik, mutabilitas / transaksi, akses ke hampir semua sumber data besar / format dan pemrosesan aliran semua dalam satu cluster terpadu.

Satu kasus penggunaan umum untuk TIBCO ComputeDB adalah memberikan analitik dengan kecepatan interaktif pada volume data yang besar dengan minimal atau tanpa pra-pemrosesan dataset. Misalnya, seringkali, tidak perlu melakukan pra-agregat / mengurangi atau menghasilkan kubus di atas kumpulan data besar pengguna untuk analitik visual ad-hoc. Hal ini dimungkinkan dengan mengelola data dalam memori secara cerdas, menghasilkan kode secara dinamis, menggunakan optimisasi vektorisasi dan memaksimalkan potensi CPU multi-core modern.

Berikut ini beberapa keuntungan menggunakan TIBCO ComputeDB:

  • Any Data, Any Source, Any Cloud

Jelajahi dan analisis data apa pun di seluruh sumber seperti streaming; Parket; Hive; dan JSON / XML, NoSQL, relasional, dan basis data cloud; file teks, dan banyak lagi.

  • Speed-of-thought Analytics

Berinovasi dan bersaing lebih efektif dengan menganalisis dan mendapatkan wawasan yang dapat ditindaklanjuti dari semua data pengguna, terlepas dari volume, kecepatan, atau variasinya. Aktifkan, analitik pada kecepatan interaktif sejati dan hilangkan kebutuhan untuk banyak tugas pengoptimalan basis data.

  • Flexible Compatibility

Jalankan program Apache Spark pengguna tanpa perubahan karena basis data dalam memori TIBCO ComputeDB 100% kompatibel dengan Apache Spark. Aplikasi mengakses data menggunakan JDBC / ODBC / REST, atau cukup gunakan Spark API yang disempurnakan melalui Scala, Java, R, atau Python.

  • Hinger Performance, Lower TCO

Sadarilah kinerja yang lebih tinggi dan TCO yang lebih rendah untuk perusahaan melalui integrasi mulus Apache Spark (sebagai mesin komputasi data besar) dengan Apache Geode (sebagai toko transaksional dalam memori dengan semantik SQL skala-out). Analitik streaming, OLTP / OLAP, dan pembelajaran mesin dalam satu basis data terintegrasi membantu ilmuwan data dan insinyur data bekerja bersama secara lebih efektif untuk mengatasi tantangan terbesar pengguna.

Selain beberapa keuntungan yang dimiliki oleh TIBCO ComputeDB, berikut beberapa kemampuan yang dimiliki TIBCO ComputeDB:

  • High performance

Ketika data dimuat, engine memparalelkan semua akses dengan mempertimbangkan dengan hati-hati core terdistribusi yang tersedia, memori yang tersedia, dan apakah data sumber dapat dipartisi untuk menghasilkan pemuatan berkecepatan sangat tinggi. Oleh karena itu, tidak seperti gudang tradisional, pengguna dapat membuka TIBCO ComputeDB kapan pun diperlukan, memuat, memproses, dan merobohkannya. Pemrosesan query menggunakan teknik pembuatan kode dan vektorisasi untuk mengalihkan pemrosesan ke prosesor multi-core modern dan cache L1 / L2 / L3 sejauh mungkin.

  • Easily discover and catalog big data sets

Pengguna dapat menghubungkan dan menemukan kumpulan data dalam SQL DB, Hadoop, toko NoSQL, sistem file, atau bahkan penyimpanan data cloud seperti S3 dengan menggunakan SQL, menyimpulkan skema secara otomatis dan mendaftarkannya dalam katalog yang aman. Berbagai macam format data didukung di luar kotak seperti JSON, CSV, teks, Objek, Parket, ORC, SQL, XML, dan banyak lagi.

  • Stream ingestion and liveness

Sistem big data yang populer saat ini menggunakan penyegaran kembali data secara berkala dari sumber karena data yang dikelola seringkali tidak dapat dimutasi. Di TIBCO ComputeDB, sistem operasional dapat memasukkan pembaruan data melalui Kafka ke TIBCO ComputeDB. Data yang masuk bisa berupa peristiwa CDC (Change-data-capture) (masukkan, perbarui, atau hapus) dan dapat dengan mudah dicerna ke dalam tabel di dalam memori dengan mudah, konsisten, dan semantik persis sekali. Aplikasi dapat menerapkan logika khusus untuk melakukan transformasi canggih dan menyiapkan data untuk analitik. Proses bertahap dan berkesinambungan ini jauh lebih efisien daripada penyegaran batch.

  • Rich connectivity

TIBCO ComputeDB dibangun dengan Apache Spark di dalamnya. Oleh karena itu, setiap penyimpanan data yang memiliki konektor Apache Spark dapat diakses menggunakan SQL atau dengan menggunakan API Apache Spark RDD / Dataset. Hampir semua toko data modern menyediakan konektor Apache Spark. Pengguna juga dapat secara dinamis menggunakan konektor ke TIBCO ComputeDB cluster yang sedang berjalan.

Reference:

https://tibco-computedb.readthedocs.io/en/enterprise_docv1.1.1/

https://www.tibco.com/products/tibco-computedb

Zaki Izzani Akbar