Memprediksi Kualitas Air Menggunakan Machine Learning: Inovasi Teknologi untuk Lingkungan Bersih dan Sehat

Dipublikasikan oleh Viskha Dwi Marcella Nanda

13 Maret 2025, 11.04

Sumber:pexels.com

Pendahuluan: Tantangan Kualitas Air di Era Modern

Air bersih adalah kebutuhan mendasar bagi kehidupan manusia. Namun, menurut data WHO (2023), lebih dari 2 miliar orang di dunia masih tidak memiliki akses ke air minum yang aman. Masalah kualitas air tidak hanya berimbas pada kesehatan masyarakat, tetapi juga berdampak pada ekonomi, lingkungan, dan pembangunan berkelanjutan.

Dalam konteks ini, paper berjudul "A Prediction of Water Quality Analysis Using Machine Learning" yang dipublikasikan pada International Conference on Distributed Computing and Electrical Circuits and Electronics (ICDCECE) 2023 menjadi sangat relevan. Para penulis mengembangkan model prediksi kualitas air berbasis machine learning, khususnya menggunakan algoritma decision tree yang diimplementasikan dengan WEKA.

📖 Sumber Paper Asli
Suma, S. et al. (2023). A Prediction of Water Quality Analysis Using Machine Learning. ICDCECE 2023.
DOI:10.1109/ICDCECE57866.2023.10150940

 

Latar Belakang: Kebutuhan Akan Analisis Kualitas Air yang Cepat dan Akurat

Selama ini, analisis kualitas air dilakukan melalui metode konvensional, yaitu uji laboratorium yang membutuhkan waktu lama dan biaya tinggi. Dalam situasi di mana kecepatan respons sangat penting—misalnya dalam kasus kontaminasi air minum—proses tradisional ini menjadi kurang efektif.

Penelitian ini menawarkan solusi dengan menggunakan machine learning, di mana data kualitas air dianalisis secara otomatis dan cepat. Tujuannya adalah memprediksi apakah air layak minum (potable) atau tidak, sehingga mempercepat pengambilan keputusan, terutama bagi lembaga pengelola sumber daya air dan kesehatan masyarakat.

 

Tujuan dan Kontribusi Penelitian

Penelitian ini bertujuan untuk:
✅ Mengembangkan sistem prediksi kualitas air berbasis data mining dan machine learning.
✅ Menggunakan data dari Kenya Water Institute sebagai studi kasus, yang kemudian dianalisis melalui algoritma decision tree di platform WEKA.
✅ Membandingkan kinerja lima model decision tree: J48, LMT (Logistic Model Tree), Random Forest, Hoeffding Tree, dan Decision Stump.
✅ Memberikan rekomendasi model prediksi terbaik berdasarkan akurasi, presisi, recall, dan F1 score.

 

Metodologi Penelitian: Dari Data Lapangan ke Prediksi Machine Learning

1. Pengumpulan dan Preprocessing Data

Data yang digunakan bersifat sekunder, diperoleh dari Kenya Water Institute. Parameter kualitas air yang dianalisis mencakup:

  • pH
  • Temperatur
  • Dissolved Oxygen (DO)
  • Ammonium
  • Nitrate
  • Turbidity
  • Phosphate
  • Dissolved Organic Carbon
  • Conductivity

Data diolah dengan metode normalisasi dan data splitting menjadi data latih dan data uji, dengan rasio 70:30.

2. Implementasi Algoritma Decision Tree

Penelitian ini menguji lima metode decision tree, antara lain:

  • J48 (Implementasi C4.5): Cocok untuk data campuran numerik dan kategorikal.
  • LMT (Logistic Model Tree): Kombinasi decision tree dan regresi logistik yang mampu mengurangi overfitting.
  • Random Forest: Model ensemble berbasis multiple decision tree yang handal terhadap noise dan data berdimensi tinggi.
  • Hoeffding Tree: Cocok untuk data streaming dengan kemampuan adaptasi cepat.
  • Decision Stump: Algoritma ringan berbasis satu atribut, cepat namun kurang akurat.

3. Evaluasi Kinerja Model

Evaluasi dilakukan dengan metrik berikut:

  • Akurasi
  • Presisi
  • Recall
  • F1-score
  • Visualisasi dilakukan untuk menggambarkan kategori air potable dan non-potable.

 

Hasil dan Temuan Penting

Akurasi Model

Hasil menunjukkan bahwa model Random Forest memberikan performa terbaik dengan akurasi tertinggi, mengungguli model lain seperti J48 dan LMT.

Prediksi Potabilitas Air

Model mampu membedakan secara efektif air yang layak diminum dan tidak, berdasarkan parameter kritis seperti pH, tingkat kekeruhan (turbidity), dan kandungan nitrate.

Visualisasi Data

Grafik potabilitas menunjukkan batas aman dan tidak aman kualitas air, dengan pH antara 6.5 - 9.0 dan DO minimal 7 mg/l sebagai indikator utama air yang aman.

 

Studi Kasus: Aplikasi Praktis di Kenya dan Potensi Global

Dampak di Kenya

Penelitian ini mendukung program pemerintah Kenya dalam mengelola sumber daya air, khususnya di wilayah yang rawan kontaminasi. Model prediksi ini berfungsi sebagai potability checker yang membantu teknisi lapangan dalam menyaring data air tanpa harus menunggu hasil laboratorium.

Potensi Implementasi Global

Model serupa dapat diadopsi di negara berkembang lain seperti India, Indonesia, dan Afrika Selatan. Dengan memanfaatkan IoT dan sensor real-time, sistem ini dapat memberikan early warning system untuk mencegah krisis air minum.

 

Analisis Kritis dan Perbandingan Penelitian Sebelumnya

Keunggulan Penelitian

Implementasi praktis: Mudah diterapkan dengan alat sederhana seperti WEKA.
Akurasi tinggi: Random Forest membuktikan keunggulannya dalam dataset kompleks.
Adaptif: Hoeffding Tree memungkinkan adaptasi dalam skenario data yang terus diperbarui.

Kelemahan dan Tantangan

Dataset Terbatas: Data hanya berasal dari Kenya, sehingga perlu validasi di wilayah dengan karakteristik air berbeda.
Kurangnya Integrasi IoT: Implementasi real-time berbasis sensor belum dilakukan.
Fokus pada Paramater Fisik dan Kimia: Belum mempertimbangkan aspek biologis seperti E. coli dan patogen lainnya.

Komparasi dengan Penelitian Lain

  • Haghiabi et al. (2018): Menggunakan ANN dan SVM untuk prediksi kualitas air di Iran, dengan akurasi serupa namun kompleksitas model lebih tinggi.
  • Chou et al. (2018): Fokus pada reservoir, sementara penelitian ini lebih aplikatif untuk sungai dan sumber air permukaan.
  • Jha & Kumar (2016): Mengembangkan decision tree untuk prediksi kualitas sungai di India, namun tanpa pendekatan ensemble seperti Random Forest.

 

Implikasi Praktis bagi Industri dan Pemerintahan

  1. Early Warning System (EWS)
    • Prediksi kualitas air membantu memberikan peringatan dini pada pengelolaan sumber daya air, mencegah konsumsi air yang berbahaya.
  2. Efisiensi Operasional
    • Mengurangi ketergantungan pada laboratorium dengan meningkatkan analisis berbasis sensor dan algoritma machine learning.
  3. Dampak Sosial
    • Memberikan akses air bersih lebih cepat, mendukung kesehatan masyarakat, dan meningkatkan SDG 6 (Sustainable Development Goals) tentang air bersih dan sanitasi.

 

Rekomendasi Pengembangan di Masa Depan

Integrasi IoT & Edge Computing
Membangun sistem real-time berbasis sensor dengan pengolahan di edge device untuk mempercepat prediksi kualitas air.

Pemanfaatan Deep Learning
Model Convolutional Neural Network (CNN) atau Recurrent Neural Network (RNN) dapat menangani dataset besar dengan pola yang lebih kompleks.

Pertimbangan Parameter Biologis dan Cuaca
Menambahkan data suhu, curah hujan, dan kontaminan biologis untuk prediksi yang lebih komprehensif.

Aplikasi Mobile
Membuat aplikasi yang dapat digunakan oleh masyarakat umum untuk mengecek kualitas air lokal secara instan.

Kesimpulan: Masa Depan Monitoring Kualitas Air Ada di Machine Learning

Penelitian oleh Suma et al. (2023) memperlihatkan potensi luar biasa dari machine learning, khususnya decision tree dan random forest, dalam membantu prediksi kualitas air. Sistem ini memberikan solusi cepat, murah, dan akurat dibandingkan metode konvensional.

Namun, implementasi penuh membutuhkan dukungan teknologi sensor real-time, infrastruktur data, dan kolaborasi multi-sektor antara pemerintah, akademisi, dan industri. Jika dikembangkan lebih lanjut, model seperti ini dapat menjadi andalan dalam menjaga keberlanjutan sumber daya air global.

Referensi Utama

  • Suma, S. et al. (2023). A Prediction of Water Quality Analysis Using Machine Learning. ICDCECE 2023.
  • Haghiabi, A. H. et al. (2018). Water quality prediction using ANN and SVM.
  • Jha, P. & Kumar, R. (2016). Decision tree approach for water quality prediction in rivers.
  • WHO (2023). Progress on Drinking Water, Sanitation and Hygiene.