Artikel Cara Install IBM Streamsets ditulis oleh Hery Purnama (Trainer Streamsets Data Collector), Jakarta, Bandung.
IBM StreamSets adalah platform integrasi data real-time yang memungkinkan pengguna untuk membuat dan mengelola aliran data cerdas melalui antarmuka grafis yang intuitif. Platform ini memfasilitasi integrasi data yang mulus di lingkungan hybrid dan multicloud, memungkinkan organisasi untuk mengakses dan memproses data secara real-time, sehingga mendukung pengambilan keputusan yang lebih cepat dan tepat.
Cloud Wars
Pada Desember 2023, IBM mengumumkan akuisisi StreamSets dan webMethods dari Software AG senilai €2,13 miliar. Akuisisi ini bertujuan untuk memperluas kapabilitas IBM dalam integrasi aplikasi dan data, serta memperkuat penawaran AI dan hybrid cloud mereka.
StreamSets menyediakan berbagai fitur, termasuk:
- Ingesti data real-time dalam skala besar: Mengurangi keterlambatan data dan memungkinkan pemrosesan jutaan catatan data dalam hitungan detik.
- Pencegahan perubahan data (data drift):Melindungi aliran data dari perubahan tak terduga dengan deteksi dan penyesuaian otomatis terhadap perubahan struktur dan skema data.
- Dukungan berbagai format data: Mampu mengintegrasikan data terstruktur, semi-terstruktur, atau tidak terstruktur dari berbagai sumber dan mengirimkannya ke berbagai tujuan.
- Antarmuka pengguna drag-and-drop: Memungkinkan pembuatan dan penerapan aliran data tanpa perlu pengkodean manual.
- Fleksibilitas deployment: Dapat diterapkan sebagai layanan SaaS di berbagai platform cloud seperti AWS, Azure, dan Google Cloud Platform, serta di lingkungan on-premise.
Dengan fitur-fitur tersebut, IBM StreamSets membantu organisasi dalam berbagai kasus penggunaan, seperti deteksi penipuan, personalisasi layanan pelanggan, pemrosesan peristiwa untuk intelijen operasional, dan penyediaan data real-time untuk aplikasi AI
Berikut Panduan Instalasi Streamsets di Windows dengan menggunakan Docker Desktop for windows
1. Pastikan minimum
Java 8 atau 11 sudah terinstall di windows
Cek di terminal
java -version
2. install Docker Desktop (jika belum punya)
- Download
docker dari: https://docs.docker.com/desktop/setup/install/windows-install/
- Pastikan
sistem mendukung:
- Windows
10/11 Pro/Enterprise
- WSL
2 aktif
- Ikuti
petunjuk instalasi sampai selesai
3. Jalankan Docker dan Cek Versi
Buka PowerShell (run
as administrator) :
docker --version
Kalau muncul versi Docker, berarti sudah siap.
4. Pull Image StreamSets Data Collector
Jalankan perintah berikut di terminal:
docker pull streamsets/datacollector:3.21.0
Tunggu sampai image selesai diunduh (~400MB).
5. Jalankan StreamSets di Docker
Setelah image berhasil di-pull, jalankan container-nya:
docker run -it --rm -p 18630:18630
streamsets/datacollector:3.21.0
- -p
18630:18630 artinya port lokal 18630 akan membuka UI StreamSets.
5. Akses
StreamSets dari Browser
Buka browser dan kunjungi:
Anda akan terhubung ke streamsets.com dan diminta membuat
akun, daftar gunakan email gmail (signin using gmail) lalu hubungkan ke http://localhost:18630 jika ada permintaan dari streamset
READY!, bisa langsung mulai bikin data pipeline
📎 Catatan:
- Image
ini adalah versi Open Source StreamSets Data Collector (bukan versi
IBM Control Hub), tapi cara kerjanya mirip.
- Jika
butuh versi IBM StreamSets yang lengkap, silahkan daftar akun dengan
email kantor dan akses cloud-nya lewat: https://www.ibm.com/products/streamsets
(trial 30 hari)