1. Pendahuluan
Di dunia industri, keputusan jarang dibuat dalam kondisi ideal. Kita jarang punya informasi lengkap. Kita sering hanya punya data yang tampak di permukaan, sementara penyebab sebenarnya tersembunyi di baliknya.
Sebuah pabrik bisa melihat angka cacat produksi meningkat, tetapi tidak langsung tahu apakah penyebabnya ada pada mesin, bahan baku, operator, atau suhu ruangan. Perusahaan asuransi bisa melihat klaim meningkat, tetapi tidak otomatis tahu karakter risiko apa yang sedang berubah. Industri sawit bisa mendeteksi penurunan produktivitas, tetapi belum tentu tahu apakah itu karena hama, cuaca, atau pola distribusi lain yang sulit dilihat langsung.
Orasi ilmiah Prof. Sapto Wahyu Indratno mengangkat persoalan ini dari sudut yang sangat menarik: statistik bukan hanya alat merangkum data, melainkan alat untuk merekonstruksi penyebab.
Dalam orasi ini, Prof. Sapto menempatkan “masalah invers” sebagai inti. Ia menjelaskan dengan cara yang sederhana: di lapangan, kita sering hanya mengetahui output, misalnya data Y, tetapi tidak tahu apa yang menghasilkan data tersebut, yakni fungsi atau mekanisme F yang tersembunyi. Tantangan terbesar masalah invers adalah bagaimana mencari fungsi F berdasarkan data lapangan yang kita punya.
Jika masalah forward adalah “kita punya penyebab, lalu memprediksi akibat”, maka masalah invers adalah kebalikannya: “kita punya akibat, lalu ingin menemukan penyebab”. Dalam praktik industri, ini lebih sering terjadi. Karena perusahaan jarang berada dalam posisi mengontrol semua variabel sejak awal. Perusahaan lebih sering bereaksi terhadap gejala.
Orasi ini memberi contoh yang terasa dekat bagi banyak orang: CT scan. Ketika kita melakukan pemindaian, kita tidak melihat organ langsung, melainkan membaca gelombang, lalu merekonstruksi apa yang terjadi di dalam tubuh. Itu adalah masalah invers dalam bentuk yang paling mudah dipahami.
Prof. Sapto juga memberi analogi sepak bola untuk menjelaskan konsepnya secara lebih ringan: masalah forward adalah ketika Persib menggunakan skema tertentu dan menghasilkan skor tertentu. Masalah invers adalah kebalikannya: jika kita ingin Persib menang, skema apa yang harus digunakan berdasarkan data historis.
Analogi ini terlihat sederhana, tetapi isinya kuat. Karena ia menunjukkan bahwa dalam masalah invers, kita tidak sedang mencari “rumus pasti”, tetapi mencari strategi terbaik dari data yang ada.
Dan dari sinilah orasi Prof. Sapto bergerak ke gagasan yang lebih dalam: dalam dunia nyata, masalah invers jarang punya jawaban tunggal.
2. Masalah Invers Klasik vs Inversi Statistik: Ketika Jawaban Tidak Unik, dan Kita Harus Berpikir dalam Bentuk Distribusi
Salah satu bagian terpenting dari orasi ini adalah perbedaan antara masalah invers klasik dan inversi statistik.
Pada masalah invers klasik, targetnya adalah menemukan satu fungsi penyebab F yang paling cocok menjelaskan data. Tetapi Prof. Sapto menegaskan bahwa banyak model invers memiliki sifat yang menyulitkan:
-
solusi tidak harus tunggal
-
bisa jadi solusi tidak ada
-
gangguan kecil pada data bisa menghasilkan perubahan solusi yang sangat besar
Dalam bahasa matematika, ini sering disebut masalah yang tidak stabil atau tidak well-posed.
Di industri, kondisi ini sering muncul karena data lapangan memang tidak bersih. Selalu ada noise. Selalu ada gangguan. Selalu ada bias pengukuran.
Karena itu, Prof. Sapto menjelaskan bahwa inversi berkembang menjadi inversi statistik, di mana solusi bukan lagi satu fungsi tunggal, melainkan distribusi dari banyak kemungkinan fungsi.
Ini adalah titik balik yang penting. Dalam praktik pengambilan keputusan, orang sering ingin jawaban tunggal: “penyebabnya apa?” Tetapi inversi statistik menawarkan cara yang lebih realistis: “penyebabnya ini, dengan tingkat keyakinan tertentu”.
Prof. Sapto menyebut bahwa dalam inversi statistik kita ingin mencari distribusi posterior. Distribusi posterior dibangun dari dua komponen:
-
prior distribution, yaitu asumsi awal sebelum melihat data
-
likelihood, yaitu komponen yang menghubungkan data dengan asumsi awal
Ketika prior digabung dengan likelihood, terbentuklah posterior distribution—distribusi yang sudah memasukkan data dan pengalaman yang dimiliki.
Untuk membuat ide ini terasa dekat, Prof. Sapto memberikan analogi yang kuat: jika kita baru pertama kali datang ke Bandung dan ditanya apakah hari ini hujan, tanpa pengalaman kita cenderung memberi peluang “setengah-setengah”. Itu contoh prior, asumsi awal sebelum ada data pengalaman. Setelah beberapa hari tinggal di Bandung dan melihat pola cuaca, kita akan memperbaiki keyakinan itu. Itulah posterior.
Dalam konteks industri, prior bisa berasal dari pengalaman perusahaan, pengetahuan domain, atau pola historis. Likelihood berasal dari data yang baru muncul. Posterior adalah hasil “pengetahuan yang diperbarui” untuk mengambil keputusan. Karena hasilnya berupa distribusi, maka kita punya banyak kemungkinan solusi. Prof. Sapto menjelaskan bahwa jika kita tetap ingin nilai tunggal untuk keputusan praktis, kita bisa mengambil rata-rata (mean) dari distribusi posterior.
Ini penting untuk dunia kerja. Karena industri sering membutuhkan angka keputusan, tetapi angka keputusan yang bagus tidak lahir dari kepastian palsu—angka keputusan yang bagus lahir dari pemahaman ketidakpastian.
Dengan inversi statistik, ketidakpastian tidak disembunyikan. Ketidakpastian justru dijadikan bagian dari model.
Dan bagi bidang aktuaria, Prof. Sapto menekankan bahwa konsep ini sangat penting karena aktuaria berurusan langsung dengan risiko. Risiko itu sendiri adalah sesuatu yang tersembunyi. Kita hanya melihat data klaim, tetapi kita ingin merekonstruksi karakter risiko agar bisa menghitung premi dan menentukan besarnya klaim ketika risiko terjadi.
Di sinilah orasi ini terasa relevan: ia bukan membahas statistik sebagai teori, tetapi statistik sebagai cara berpikir menghadapi keputusan nyata.
Siap, lanjut. Ini Section 3–4 sesuai struktur yang tadi aku janjikan: proses Gaussian, tantangan data besar, lalu rangkaian studi kasus yang memperlihatkan bagaimana inversi statistik “turun ke lapangan”.
3. Proses Gaussian dan Tantangan Data Besar: Saat Masalahnya Bukan Lagi Rumus, tapi Komputasi
Begitu inversi statistik dipahami sebagai upaya mencari distribusi posterior (bukan satu jawaban tunggal), muncul pertanyaan berikutnya yang lebih praktis: bagaimana cara menghitungnya?
Di sinilah orasi Prof. Sapto Wahyu Indratno membawa kita ke salah satu alat yang paling sering dipakai dalam pemodelan fungsi: proses Gaussian.
Inti dari proses Gaussian adalah gagasan sederhana: daripada menebak nilai parameter satu per satu, kita memodelkan fungsi sebagai objek acak yang memiliki struktur. Jadi targetnya bukan angka-angka terpisah, tetapi bentuk fungsi yang konsisten.
Dalam banyak masalah invers, memang lebih logis memodelkan fungsi daripada memodelkan titik. Karena titik data yang kita miliki sering sedikit, sementara fenomena yang ingin kita pahami adalah kontinu.
Namun kekuatan proses Gaussian sekaligus membawa tantangan besar: komputasi.
Orasi Prof. Sapto menekankan bahwa pada proses Gaussian, pembentukan distribusi posterior biasanya membutuhkan inversi matriks kovarians, dan inversi matriks ini memiliki kompleksitas komputasi yang berat, terutama ketika data membesar.
Di sini masalahnya bukan lagi apakah kita “tahu teorinya”, tetapi apakah sistem bisa menghitungnya dalam waktu masuk akal.
Secara intuitif, semakin banyak data, semakin besar matriksnya, dan semakin mahal biaya komputasinya. Ini membuat inversi statistik berada di wilayah yang sangat relevan dengan tantangan modern: era big data tidak selalu membuat analisis lebih mudah, justru sering membuatnya lebih mahal untuk dihitung.
Karena itu, orasi ini menekankan perlunya reduksi komputasi. Strategi yang dipakai antara lain adalah pendekatan yang mereduksi ukuran matriks atau menggunakan teknik aproksimasi. Ini dilakukan agar model tetap bisa digunakan, bukan hanya benar di atas kertas.
Bagi mahasiswa, bagian ini memberi pelajaran penting: statistik modern tidak hanya menuntut kemampuan konsep, tetapi juga menuntut kemampuan komputasi. Banyak ide statistik yang bagus tidak akan dipakai jika tidak bisa dijalankan secara efisien.
Bagi pekerja industri, bagian ini menunjukkan satu realitas: model paling canggih bukan yang paling kompleks, tetapi yang bisa dipakai. Banyak perusahaan tidak butuh model yang sempurna secara teoretis. Mereka butuh model yang stabil, cukup akurat, dan bisa diproses cepat.
Di sinilah proses Gaussian memiliki nilai besar. Ia memberi cara untuk memodelkan fungsi dalam bentuk distribusi, tetapi tetap harus dipasangkan dengan strategi komputasi agar bisa digunakan pada data yang besar.
Secara praktis, bagian ini mempertegas pesan awal orasi: dalam masalah invers, kita tidak bisa berharap pada kepastian absolut. Kita harus bekerja dengan probabilitas. Tetapi untuk bekerja dengan probabilitas, kita harus punya mesin komputasi yang mampu menghitung.
4. Studi Kasus Penerapan Inversi Statistik: Dari Citra, Tulisan Tangan, Sawit, sampai Asuransi Siber
Yang membuat orasi Prof. Sapto Wahyu Indratno terasa kuat adalah ia tidak berhenti pada konsep posterior, prior, likelihood, dan proses Gaussian. Ia membawa konsep itu ke lapangan, ke beberapa domain yang terlihat berbeda, tetapi sebenarnya punya struktur masalah yang mirip: kita mengamati data output, lalu ingin merekonstruksi sesuatu yang tersembunyi.
4.1 Image processing: membangun kembali gambar dari data yang tidak lengkap
Dalam image processing, kita sering punya data pengamatan yang “rusak” atau tidak lengkap. Bisa karena noise, bisa karena sensor, atau bisa karena keterbatasan resolusi.
Masalahnya tetap sama: kita ingin menemukan citra yang sebenarnya berdasarkan data yang terlihat.
Ini adalah masalah invers yang jelas, karena citra asli adalah “F” yang tersembunyi, sementara data pengamatan adalah “Y” yang terlihat.
Dengan pendekatan statistik, kita tidak hanya menghasilkan satu gambar hasil rekonstruksi, tetapi bisa memahami tingkat ketidakpastian pada bagian-bagian tertentu dari citra tersebut. Ini penting dalam aplikasi yang sensitif seperti medical imaging atau quality inspection di industri.
4.2 Klasifikasi tulisan tangan: ketika data tampak sederhana, tetapi variasinya liar
Tulisan tangan terlihat seperti masalah yang mudah karena manusia bisa membaca dengan cepat. Tetapi dalam komputasi, tulisan tangan adalah masalah yang kompleks karena variasi bentuk antar individu sangat besar.
Orasi menyebut tulisan tangan sebagai salah satu contoh penerapan.
Dalam struktur inversi statistik, targetnya bukan hanya mengenali bentuk huruf, tetapi memahami pola fungsi yang menghasilkan bentuk itu dalam ruang fitur tertentu.
Pendekatan probabilistik menjadi penting karena tidak ada satu bentuk “A” yang universal. Ada banyak bentuk A, dan model harus bisa mengakomodasi variasi itu sebagai distribusi, bukan sebagai satu template tetap.
4.3 Deteksi serangan ulat pada tanaman sawit: ketika risiko ekonomi besar muncul dari gejala kecil
Salah satu contoh yang paling relevan untuk konteks Indonesia adalah serangan ulat pada tanaman sawit. Orasi Prof. Sapto menyinggung ini sebagai studi kasus penting.
Di industri sawit, serangan hama bukan sekadar persoalan biologis. Ia adalah persoalan ekonomi. Ketika serangan terlambat terdeteksi, produktivitas turun dan kerugian membesar.
Namun mendeteksi serangan di lapangan tidak selalu mudah. Yang terlihat mungkin hanya gejala kecil pada daun atau perubahan pola tertentu. Dari gejala itu, sistem perlu menyimpulkan apakah benar ada serangan, seberapa luas, dan seberapa parah.
Struktur masalahnya lagi-lagi invers: data gejala adalah output, sementara kondisi serangan adalah penyebab tersembunyi. Pendekatan statistik memberi cara untuk mengambil keputusan dalam kondisi ketidakpastian.
Dan nilai tambahnya adalah ini: jika keputusan bisa dibuat lebih cepat, maka intervensi bisa lebih cepat. Dalam industri, “lebih cepat” sering lebih penting daripada “lebih sempurna”, karena keterlambatan beberapa hari saja bisa mengubah skala kerusakan.
4.4 Tarif asuransi siber: ketika risiko bukan benda fisik, tetapi pola komunikasi jaringan
Bagian yang paling terasa modern dari orasi ini adalah penerapan inversi statistik pada asuransi siber.
Jika asuransi konvensional berbicara tentang kendaraan, kesehatan, atau kebakaran, maka asuransi siber berbicara tentang risiko yang bentuknya tidak bisa disentuh: serangan pada sistem jaringan, pencurian data, gangguan layanan.
Prof. Sapto menekankan bahwa dalam konteks ini, tarif premi bisa ditentukan dengan memodelkan struktur jaringan komunikasi.
Ini menarik karena risiko siber tidak bisa diukur dengan cara lama seperti “jumlah tahun pengalaman pengemudi” atau “lokasi rumah”. Risiko siber berhubungan dengan:
-
bagaimana perangkat saling terhubung
-
seberapa rapuh titik tertentu dalam jaringan
-
bagaimana informasi mengalir
-
bagaimana sistem merespons ketika ada serangan
Dengan inversi statistik, data serangan dan pola komunikasi bisa dipakai untuk merekonstruksi profil risiko, lalu profil risiko itulah yang menentukan tarif premi.
Di sinilah terlihat bahwa inversi statistik adalah bahasa yang fleksibel. Ia bisa dipakai pada citra, tulisan tangan, pertanian, dan finansial karena strukturnya sama: kita melihat akibat, lalu ingin menebak sebab.
5. Kenapa Inversi Statistik Relevan untuk Keputusan Industri: Ketidakpastian Bukan Gangguan, tapi Informasi
Salah satu kesalahan paling umum dalam pengambilan keputusan industri adalah menganggap ketidakpastian sebagai sesuatu yang harus “dihilangkan”. Seolah data yang bagus adalah data yang bebas noise, dan keputusan yang bagus adalah keputusan yang pasti.
Orasi Prof. Sapto Wahyu Indratno justru mengajak kita membalik cara berpikir itu. Dalam masalah invers, ketidakpastian bukan sekadar gangguan. Ketidakpastian adalah bagian dari realitas yang harus dihitung.
Karena dunia industri bukan laboratorium.
Di industri, data lapangan selalu:
-
tidak lengkap
-
terpengaruh noise
-
punya bias pengukuran
-
berubah seiring waktu
-
terikat kondisi lingkungan
Jika kita memaksakan satu jawaban tunggal dari data yang tidak ideal, kita akan menciptakan kepastian palsu. Dan kepastian palsu sering lebih berbahaya daripada ketidakpastian yang diakui.
Prof. Sapto menjelaskan bahwa masalah invers bertujuan menemukan mekanisme F dari data Y. Tetapi masalahnya, dalam banyak kasus solusi bisa tidak unik, bahkan bisa tidak stabil terhadap perubahan kecil pada data.
Maka inversi statistik menawarkan cara yang lebih realistis: solusi dinyatakan sebagai distribusi posterior, bukan sebagai satu angka tunggal.
Ini bukan kelemahan. Ini justru kekuatan.
Karena keputusan yang baik bukan keputusan yang “pasti”, tetapi keputusan yang memahami risiko.
5.1 Prior, likelihood, posterior: format kerja yang cocok untuk dunia kerja
Orasi menekankan bahwa posterior dibentuk dari prior distribution dan likelihood.
Dalam bahasa industri, prior adalah pengetahuan atau pengalaman sebelumnya. Likelihood adalah data baru yang masuk. Posterior adalah pembaruan keyakinan setelah data baru dipertimbangkan.
Yang menarik, pola ini persis seperti proses pengambilan keputusan nyata:
-
perusahaan punya pengalaman historis
-
perusahaan melihat data terbaru
-
perusahaan memperbarui strategi
Kalau proses ini dilakukan tanpa statistik, ia sering berubah menjadi intuisi yang tidak terukur. Inversi statistik membuatnya menjadi prosedur yang bisa dihitung.
5.2 Mengubah pertanyaan “apa penyebabnya?” menjadi “apa penyebabnya dengan tingkat keyakinan berapa?”
Dalam dunia kerja, pertanyaan penyebab sering diminta dalam bentuk tunggal:
-
“mesinnya rusak apa tidak?”
-
“produk ini aman atau tidak?”
-
“risikonya tinggi atau rendah?”
Padahal jawaban nyata sering tidak bisa biner.
Inversi statistik memberikan jawaban yang lebih jujur: ada beberapa kemungkinan penyebab, dan setiap kemungkinan punya probabilitas.
Jika manajemen butuh angka tunggal, Prof. Sapto menyebut bahwa kita dapat mengambil mean dari distribusi posterior.
Tetapi nilai tambahnya bukan pada mean saja. Nilai tambahnya ada pada sebaran posterior itu sendiri, karena sebaran menunjukkan:
-
seberapa yakin model terhadap estimasi
-
seberapa besar risiko kesalahan
-
seberapa sensitif keputusan terhadap perubahan data
Di industri, informasi semacam ini sangat mahal nilainya.
Karena tidak semua keputusan harus diambil dengan tingkat kehati-hatian yang sama. Keputusan dengan risiko tinggi butuh kepastian lebih tinggi. Keputusan operasional cepat bisa diambil dengan ketidakpastian lebih besar, asalkan dampaknya kecil.
Inversi statistik membantu memberi struktur pada pembagian jenis keputusan itu.
5.3 Relevansi untuk aktuaria dan risiko: karena risiko selalu sesuatu yang tersembunyi
Prof. Sapto menegaskan relevansi inversi statistik untuk aktuaria: aktuaria berhadapan dengan risiko yang tidak tampak, dan harus mengukur risiko dari data klaim.
Ini sangat masuk akal. Dalam asuransi, kita tidak melihat risiko “secara langsung”. Yang terlihat hanya kejadian: klaim, kerugian, frekuensi, dan dampak. Dari data itu, perusahaan ingin menebak struktur risiko agar bisa:
-
menentukan premi
-
menjaga stabilitas keuangan
-
menghindari underpricing atau overpricing
-
memprediksi klaim masa depan
Sistem seperti ini secara alami adalah masalah invers.
Dan ketika risikonya berkembang ke risiko siber yang berbasis jaringan komunikasi, kebutuhan inversi statistik semakin jelas. Karena kita tidak mungkin mengukur “kerentanan” jaringan hanya dari satu parameter. Kita harus mengolah pola, struktur, dan hubungan.
5.4 Tantangan sebenarnya: komputasi, bukan sekadar teori
Orasi ini juga menegaskan bahwa proses Gaussian dan metode statistik lanjut membutuhkan komputasi berat seperti inversi matriks kovarians.
Artinya, tantangan penerapan inversi statistik di industri sering bukan pada “apakah teorinya bagus”, tetapi pada “apakah bisa dihitung cepat dan stabil”.
Itulah mengapa reduksi komputasi menjadi bagian penting dari implementasi.
Jika konsep tidak bisa dijalankan di dunia nyata, maka konsep itu akan berhenti sebagai materi seminar.
6. Kesimpulan: Industri Tidak Bisa Menunggu Data Sempurna, Jadi Kita Harus Belajar Membaca Penyebab dari Gejala
Orasi Prof. Sapto Wahyu Indratno menempatkan inversi statistik sebagai cara berpikir yang sangat relevan untuk dunia nyata. Banyak keputusan industri dibuat bukan dari informasi lengkap, tetapi dari data yang tampak di permukaan, sementara mekanisme penyebabnya tersembunyi. Dalam bahasa orasi, kita sering hanya punya data Y dan ingin menemukan fungsi atau mekanisme F yang menghasilkan data tersebut.
Masalah invers seperti ini sering tidak stabil, tidak unik, atau bahkan tidak memiliki solusi yang jelas. Karena itu, inversi statistik menawarkan pendekatan yang lebih realistis: kita tidak lagi mencari satu jawaban tunggal, tetapi mencari distribusi posterior yang merepresentasikan banyak kemungkinan solusi sekaligus. Posterior dibangun dari prior distribution dan likelihood, sehingga pengetahuan awal diperbarui oleh data lapangan secara sistematis.
Pendekatan ini sangat relevan untuk industri karena memungkinkan pengambilan keputusan berbasis ketidakpastian yang terukur, bukan kepastian palsu. Ketika diperlukan angka tunggal untuk kebijakan, mean dari posterior dapat digunakan, tetapi sebaran posterior tetap memberi nilai karena menunjukkan tingkat keyakinan dan risiko kesalahan.
Orasi ini juga menunjukkan bahwa penerapan inversi statistik dapat menjangkau berbagai domain, dari image processing dan klasifikasi tulisan tangan hingga deteksi serangan ulat pada tanaman sawit dan perhitungan tarif asuransi siber berbasis struktur jaringan komunikasi. Semua contoh ini memiliki pola yang sama: kita melihat akibat, lalu berusaha merekonstruksi penyebab.
Di sisi lain, orasi ini mengingatkan bahwa tantangan besar penerapan metode statistik modern adalah komputasi, terutama ketika melibatkan proses Gaussian dan inversi matriks pada data besar. Karena itu, strategi reduksi komputasi menjadi bagian penting agar model tidak berhenti sebagai teori.
Bagi mahasiswa, orasi ini menegaskan bahwa statistik bukan hanya tentang rumus, tetapi tentang cara memahami dunia ketika jawabannya tidak tunggal. Bagi pekerja industri, orasi ini memberi pesan strategis: perusahaan tidak bisa menunggu data sempurna untuk mengambil keputusan, jadi kemampuan membaca penyebab dari gejala adalah kompetensi yang menentukan.
Pada akhirnya, inversi statistik bukan sekadar cabang statistik. Ia adalah alat untuk menjembatani teori dan praktik, terutama ketika dunia nyata selalu datang dengan ketidakpastian.
Daftar Pustaka
Institut Teknologi Bandung. Orasi Ilmiah Guru Besar ITB Prof. Sapto Wahyu Indratno: Inversi Statistik dan Aplikasinya. 2024.
Tarantola, A. Inverse Problem Theory and Methods for Model Parameter Estimation. SIAM.
Stuart, A. M. Inverse Problems: A Bayesian Perspective. Acta Numerica. 2010.
Rasmussen, C. E., & Williams, C. K. I. Gaussian Processes for Machine Learning. MIT Press.
Gelman, A., et al. Bayesian Data Analysis. Chapman and Hall/CRC.