Optimalisasi Model Menuju Lingkungan Sehat dan Berkelanjutan

Dipublikasikan oleh Viskha Dwi Marcella Nanda

14 Maret 2025, 09.38

Sumber: pexels.com

Pendahuluan: Mengapa Prediksi Kualitas Udara Semakin Penting?

Kualitas udara merupakan isu krusial dalam kesehatan masyarakat dan lingkungan global. Laporan World Health Organization (WHO) tahun 2022 menyebutkan bahwa 9 dari 10 orang di dunia menghirup udara yang tidak sehat, menyebabkan lebih dari 7 juta kematian dini setiap tahunnya. Kota-kota besar seperti Chicago, New Delhi, dan Beijing menghadapi tantangan berat dalam mengelola polusi udara akibat urbanisasi dan industrialisasi.

Paper ini, yang diterbitkan dalam jurnal Big Data and Cognitive Computing (BDCC), mengulas bagaimana machine learning (ML)—khususnya teknik multi-task learning (MTL) dan regularisasi model—dapat digunakan untuk memprediksi kualitas udara secara akurat. Prediksi ini berfokus pada polutan utama seperti ozon (O3), partikulat halus (PM2.5), dan sulfur dioksida (SO2).

📖 Sumber Asli:
Dixian Zhu et al. (2018). A Machine Learning Approach for Air Quality Prediction: Model Regularization and Optimization. BDCC, 2(1), 5.
DOI: 10.3390/bdcc2010005

 

Latar Belakang: Tantangan dan Kebutuhan Prediksi Kualitas Udara

Kualitas udara dipengaruhi oleh berbagai faktor, seperti emisi industri, transportasi, dan kondisi meteorologi. Penelitian sebelumnya menggunakan model statistik konvensional, namun seringkali terbatas pada data historis dalam jangka waktu pendek dan gagal menangkap dinamika temporal serta spasial yang kompleks.

Mengapa Machine Learning?

Teknik ML modern memungkinkan pemrosesan big data yang mencakup ribuan variabel dalam waktu singkat. Dengan algoritma optimasi skala besar, ML bisa mempelajari pola yang sulit diidentifikasi oleh model tradisional. Dalam paper ini, penulis memanfaatkan pendekatan MTL, mengembangkan model prediksi multi-jam, sekaligus menerapkan regularisasi untuk meningkatkan generalisasi model.

 

Tujuan Penelitian

  1. Meningkatkan akurasi prediksi polutan udara (O3, PM2.5, SO2) dalam rentang waktu 24 jam.
  2. Mengurangi kompleksitas model dengan parameter efisien melalui teknik regularisasi.
  3. Mengembangkan model multi-task learning (MTL) yang mempertimbangkan hubungan antar waktu (temporal dependencies).
  4. Menyediakan solusi prediksi kualitas udara berbasis big data yang dapat diterapkan di berbagai wilayah urban.

 

Data dan Metodologi Penelitian

1. Sumber Data

  • Lokasi Pengambilan Data: Kota Chicago, Amerika Serikat.
  • Periode: 10 tahun (2006-2015).
  • Sumber Data:
    • EPA Air Quality System (AQS) untuk data polusi udara.
    • MesoWest untuk data meteorologi (angin, suhu, kelembaban, dll.).

Data dikumpulkan dari dua stasiun kualitas udara dan dua stasiun meteorologi, masing-masing di lokasi Alsip Village dan Lemont Village.

2. Fitur Data

  • 60 fitur mencakup:
    • 9 variabel meteorologi (angin, suhu, kelembaban, dll.).
    • 31 kondisi cuaca (cerah, hujan, kabut, dll.).
    • 16 arah angin.
    • 2 fitur boolean (weekend/weekday).
    • Data polutan untuk O3, PM2.5, SO2.

Semua data dinormalisasi agar nilai fitur berada di rentang [0,1].

3. Model dan Regularisasi

Peneliti mengembangkan tiga jenis model:

  • Baseline Model: Parameter minimal, prediksi setiap jam sama.
  • Heavy Model: Kompleks, mempertimbangkan semua variabel 24 jam.
  • Light Model: Kompromi antara baseline dan heavy, lebih efisien.

4. Regularisasi yang Diterapkan

  • Frobenius Norm: Regularisasi umum pada parameter.
  • ℓ2,1-Norm: Memperkuat seleksi fitur antar tugas.
  • Nuclear Norm: Menekan rank matriks untuk menangkap keterkaitan antar jam.
  • Consecutive Close (CC) Regularization: Pendekatan baru untuk mendekatkan prediksi antar jam berurutan.

 

Temuan dan Hasil Penelitian

Kinerja Model

  • Light Model dengan CC Regularization memberikan hasil terbaik.
  • Model ini mengurangi Root Mean Squared Error (RMSE) lebih dari 15% dibanding baseline.
  • RMSE untuk O3 di dataset LMA-AV turun dari 0,1324 menjadi 0,11535.

Efisiensi Optimasi

  • Penggunaan algoritma LA-SADMM dan ASSG mempercepat konvergensi model 3 kali lipat dibanding metode klasik.

 

Studi Kasus: Chicago, Amerika Serikat

Chicago dipilih karena mewakili kota besar dengan masalah polusi udara kompleks. Ozon (O3) menjadi perhatian utama karena tidak sesuai standar EPA meskipun emisi NOx dan VOC telah menurun sejak 1970-an. Hasil prediksi menunjukkan bahwa:

  • Kondisi meteorologi, seperti kelembaban tinggi dan kecepatan angin rendah, memicu lonjakan konsentrasi PM2.5 dan SO2.
  • Prediksi berbasis ML membantu otoritas lingkungan menetapkan peringatan dini polusi hingga 24 jam sebelumnya.

 

Analisis Kritis

Kelebihan Penelitian

✅ Menggunakan dataset besar selama 10 tahun.
✅ Pendekatan multi-task learning (MTL) memperhitungkan korelasi antar jam.
✅ Pengembangan regularisasi baru (CC Regularization) yang intuitif dan efektif.
Efisiensi komputasi ditingkatkan melalui algoritma optimasi canggih.

Keterbatasan

❌ Data hanya dari satu wilayah (Chicago), kurang representatif untuk global.
❌ Belum mengintegrasikan real-time IoT sensor secara langsung.
❌ Fokus pada model linear regression, belum eksplorasi metode deep learning yang mungkin lebih baik.

Perbandingan dengan Studi Sebelumnya

  • Kurt dan Oktay (2010): Neural Network untuk prediksi 3 hari sebelumnya, tanpa regularisasi antar waktu.
  • Corani (2005): Pruned Neural Network (PNN), hanya prediksi O3 dan PM10.
  • Penelitian Zhu et al. (2018) mengungguli studi sebelumnya dengan multi-tasking, regularisasi inovatif, dan evaluasi big data.

 

Implikasi Praktis dan Tren Industri

Potensi di Kota-Kota Besar

Model ini relevan untuk kota seperti Jakarta atau Delhi, di mana prediksi kualitas udara penting untuk kesehatan publik. Implementasi real-time alert system berbasis prediksi ini dapat mengurangi paparan polusi bagi masyarakat.

Transformasi Smart City

  • Integrasi dengan IoT dan Edge Computing: Data sensor dapat langsung diproses oleh model prediktif.
  • Kebijakan Lingkungan Proaktif: Prediksi berbasis data memungkinkan pemerintah memberlakukan pembatasan lalu lintas atau penutupan industri sementara.

 

Rekomendasi Pengembangan Selanjutnya

  1. Integrasi IoT & Edge AI: Prediksi lebih responsif dengan input sensor real-time.
  2. Eksplorasi Deep Learning: CNN, RNN, dan Transformer untuk pola temporal yang lebih kompleks.
  3. Transfer Learning Multikawasan: Memungkinkan model dilatih di satu lokasi dan diterapkan di wilayah lain.
  4. Visualisasi Data Interaktif: Dashboard prediksi yang mudah digunakan masyarakat dan regulator.

 

 

Kesimpulan: Masa Depan Prediksi Kualitas Udara Berbasis Data

Penelitian ini menunjukkan bahwa multi-task learning dan regularisasi yang tepat dapat menghasilkan model prediksi kualitas udara yang lebih akurat dan efisien. Di masa depan, solusi berbasis machine learning seperti ini akan menjadi bagian integral dari Smart City dan Sustainability Agenda global.

Dengan prediksi akurat hingga 24 jam sebelumnya, masyarakat dapat lebih siap menghadapi polusi udara, sementara pemerintah memiliki data yang kuat untuk pengambilan keputusan berbasis sains.

 

Referensi

  • Zhu, D., Cai, C., Yang, T., & Zhou, X. (2018). A Machine Learning Approach for Air Quality Prediction: Model Regularization and Optimization. BDCC, 2(1), 5. DOI: 10.3390/bdcc2010005
  • Kurt, A. & Oktay, A. B. (2010). Forecasting air pollutant indicator levels with geographic models. Expert Systems with Applications, 37(12), 7986-7992.
  • Corani, G. (2005). Air quality prediction in Milan: Feed-forward neural networks, pruned neural networks and lazy learning. Ecological Modelling, 185(2-4), 513-529.