PT. HM. SAMPOERNA, Tbk. - Pasuruan Jawa Timur

INHOUSE TRAINING VBA MACRO PROGRAMMING

PT. PLN PERSERO MALUKU / MALUKU UTARA

INHOUSE TRAINING I.S GOVERNANCE

O-Shop, SCTV, Infotech (Jakarta)

PUBLIC TRAINING MAGENTO ADVANCED

PT. ASKRINDO - JAKARTA

PUBLIC TRAINING PMP PMBOK EXAM PREPARATION

Bank Fama International - Bandung

INHOUSE TRAINING CYBERSECURITY AWARENESS PROGRAM

Saturday, March 29, 2025

Cara Install IBM Streamsets Data Collector di Windows (by Hery Purnama Trainer Streamset)

Artikel Cara Install IBM Streamsets ditulis oleh Hery Purnama (Trainer Streamsets Data Collector), Jakarta, Bandung.


​IBM StreamSets adalah platform integrasi data real-time yang memungkinkan pengguna untuk membuat dan mengelola aliran data cerdas melalui antarmuka grafis yang intuitif. Platform ini memfasilitasi integrasi data yang mulus di lingkungan hybrid dan multicloud, memungkinkan organisasi untuk mengakses dan memproses data secara real-time, sehingga mendukung pengambilan keputusan yang lebih cepat dan tepat. ​

Cloud Wars

Pada Desember 2023, IBM mengumumkan akuisisi StreamSets dan webMethods dari Software AG senilai €2,13 miliar. Akuisisi ini bertujuan untuk memperluas kapabilitas IBM dalam integrasi aplikasi dan data, serta memperkuat penawaran AI dan hybrid cloud mereka. ​

StreamSets menyediakan berbagai fitur, termasuk:​

  •  Ingesti data real-time dalam skala besar: Mengurangi keterlambatan data dan memungkinkan pemrosesan jutaan catatan data dalam hitungan detik.​
  • Pencegahan perubahan data (data drift):Melindungi aliran data dari perubahan tak terduga dengan deteksi dan penyesuaian otomatis terhadap perubahan struktur dan skema data.​
  • Dukungan berbagai format data: Mampu mengintegrasikan data terstruktur, semi-terstruktur, atau tidak terstruktur dari berbagai sumber dan mengirimkannya ke berbagai tujuan.​
  • Antarmuka pengguna drag-and-drop: Memungkinkan pembuatan dan penerapan aliran data tanpa perlu pengkodean manual.​
  • Fleksibilitas deployment: Dapat diterapkan sebagai layanan SaaS di berbagai platform cloud seperti AWS, Azure, dan Google Cloud Platform, serta di lingkungan on-premise. ​

Dengan fitur-fitur tersebut, IBM StreamSets membantu organisasi dalam berbagai kasus penggunaan, seperti deteksi penipuan, personalisasi layanan pelanggan, pemrosesan peristiwa untuk intelijen operasional, dan penyediaan data real-time untuk aplikasi AI


Berikut Panduan Instalasi Streamsets di Windows dengan menggunakan Docker Desktop for windows

 

1. Pastikan  minimum Java 8 atau 11 sudah terinstall di windows
Cek di terminal

java -version

2. install Docker Desktop (jika belum punya)

3. Jalankan Docker dan Cek Versi

Buka  PowerShell (run as administrator) :

docker --version

Kalau muncul versi Docker, berarti sudah siap.

 

4. Pull Image StreamSets Data Collector

Jalankan perintah berikut di terminal:

docker pull streamsets/datacollector:3.21.0

Tunggu sampai image selesai diunduh (~400MB).

 

5. Jalankan StreamSets di Docker

Setelah image berhasil di-pull, jalankan container-nya:

docker run -it --rm -p 18630:18630 streamsets/datacollector:3.21.0

  • -p 18630:18630 artinya port lokal 18630 akan membuka UI StreamSets.

 

 5. Akses StreamSets dari Browser

Buka browser dan kunjungi:

http://localhost:18630

Anda akan terhubung ke streamsets.com dan diminta membuat akun, daftar gunakan email gmail (signin using gmail) lalu hubungkan ke http://localhost:18630  jika ada permintaan dari streamset

READY!, bisa langsung mulai bikin data pipeline

 

📎 Catatan:

  • Image ini adalah versi Open Source StreamSets Data Collector (bukan versi IBM Control Hub), tapi cara kerjanya mirip.
  • Jika butuh versi IBM StreamSets yang lengkap, silahkan daftar akun dengan email kantor dan akses cloud-nya lewat: https://www.ibm.com/products/streamsets (trial 30 hari)