Teknologi
Dipublikasikan oleh Melchior Celtic pada 10 November 2025
Pertama, mari kita sepakati: jalanan kita saat ini bodoh. Sistem keselamatan mobil kita, secanggih apa pun, pada dasarnya reaktif. Mereka punya sensor, tapi mereka bereaksi terhadap apa yang sudah terjadi. Rem darurat otomatis baru bekerja setelah seorang anak berlari ke jalan.
Masalahnya, seperti yang dijabarkan di bagian "Motivation" paper ini, dunia tidak memberi kita kemewahan waktu.
Para peneliti menyoroti statistik suram dari World Health Organization: 27% dari 1,24 juta korban jiwa lalu lintas di seluruh dunia adalah VRU. Di Jerman, tempat penelitian ini berasal, 69% kecelakaan fatal terjadi di perkotaan, terutama di persimpangan.
Mengapa persimpangan begitu mematikan? Para peneliti menunjuk dua alasan yang sangat manusiawi:
Oklusi (Occlusions): Sederhananya, titik buta. Mobil Anda tidak bisa melihat anak yang berlari dari balik bus yang sedang parkir atau pesepeda yang terhalang truk.
Ketidakpastian (Unpredictability): Ini yang paling penting. Pejalan kaki dan pesepeda bisa "secara tiba-tiba memulai gerakan atau mengubah arah" dalam "beberapa ratus milidetik".
Sistem reaktif gagal total menghadapi dua masalah ini. Saat sensor mobil Anda akhirnya melihat anak yang keluar dari balik bus (memecahkan oklusi), Anda mungkin sudah tidak punya waktu "beberapa ratus milidetik" itu untuk bereaksi.
Di sinilah letak lompatan konseptual besar dari paper ini. Solusinya tidak bisa reaktif; ia harus prediktif. Kita tidak perlu mendeteksi gerakan pejalan kaki; kita perlu mendeteksi niat mereka untuk bergerak.
Saat Mobil, Lampu Lalu Lintas, dan Ponsel Anda Mulai Berbisik
Jadi, bagaimana cara Anda memprediksi niat? Anda tidak bisa memasang satu kamera super di setiap mobil dan berharap selesai. Masalah oklusi tetap ada.
Solusi brilian yang diusulkan paper ini adalah: "Collective Intelligence" (CI) atau Kecerdasan Kolektif.
Lupakan ide tentang satu mobil super-jenius ala Tesla yang berjuang sendirian. Bayangkan satu mobil adalah satu neuron. Sendirian, dia tidak terlalu pintar. Dia hanya bisa melihat apa yang ada tepat di depannya. Tapi paper ini mengusulkan untuk menghubungkan semua neuron di persimpangan.
Siapa "agen" dalam jaringan kecerdasan kolektif ini?
Kendaraan Cerdas: Mobil Anda, mobil di sebelah Anda, bus di depan Anda.
Infrastruktur: Ini adalah pengubah permainan. Kamera di lampu lalu lintas, pemindai laser yang dipasang di sudut jalan.
VRU Sendiri: Dan ini bagian yang paling menarik. Smartphone Anda, smartwatch Anda, atau sensor yang Anda pakai.
Tiba-tiba, masalah oklusi mulai terpecahkan. Mobil Anda tidak bisa melihat pesepeda di balik bus. Tapi, kamera di tiang lampu lalu lintas bisa melihatnya. Dan smartphone di saku si pesepeda tahu dari akselerometernya bahwa dia sedang bergerak.
Ketika semua agen ini "berbisik" satu sama lain melalui jaringan ad hoc , mereka menciptakan apa yang disebut paper ini sebagai "Global Vision" atau pandangan-dewa dari persimpangan. Tujuannya adalah untuk "memperluas cakrawala persepsi" setiap agen individu melampaui sensor mereka sendiri.
Sistem "agen" heterogen yang saling berbicara dan berbagi data ini adalah definisi buku teks dari(https://diklatkerja.com/course/internet-of-things-basic). Ini bukan lagi kulkas pintar yang memesan susu; ini adalah infrastruktur yang saling terhubung yang dirancang untuk menyelamatkan nyawa.
Paper Ini Tidak Sedang Memprediksi Ke Mana Anda Pergi, Tapi Bagaimana Anda Akan Pergi
Di sinilah letak inti teknis dari paper ini, dan bagian yang paling membuat saya terkesan. Oke, sistemnya bisa "melihat" semua orang. Terus? Bagaimana itu membedakannya dari sistem pengawasan biasa?
Jawabannya: sistem ini tidak hanya melacak titik. Ia mencoba membaca pikiran.
Para peneliti membagi "Intention Detection" menjadi dua lapisan yang berbeda namun saling berhubungan.
H3: Lapisan Niat Pertama: Prediksi Gerakan Dasar (The 'Vibe')
Ini adalah "getaran" atau "bahasa tubuh" dari seorang VRU. Secara teknis, mereka menyebutnya "Basic Movement Primitive Prediction".
Sistem ini tidak hanya melihat "objek pejalan kaki". Ia dilatih menggunakan machine learning untuk mengenali perbedaan halus antara:
Seseorang yang "berdiri" (mungkin menunggu bus).
Seseorang yang "berdiri-dan-akan-berjalan" (misalnya, ada pergeseran berat badan, kepala menoleh berulang kali ke arah lalu lintas).
Seorang pesepeda yang "mengayuh stabil".
Seorang pesepeda yang "melambat untuk berhenti".
Seorang pesepeda yang "melambat-sambil-menoleh-ke-belakang-untuk-berbelok".
Sistem ini bahkan dilatih untuk mengenali gestur, seperti "mengangkat lengan untuk memberi tanda belok". Ini adalah deteksi transisi keadaan. Ini adalah psikologinya.
H3: Lapisan Niat Kedua: Ramalan Lintasan (The 'Physics')
Setelah, dan hanya setelah, sistem memahami niat ("dia akan berbelok"), barulah ia bisa memprediksi jalur fisiknya secara akurat.
Ini disebut "Forecast of the future trajectory". Ini adalah ramalan fisika murni: ke mana titik-titik di tubuh orang itu (kepala, pusat gravitasi, persendian) akan bergerak dalam ruang 3D selama 1-3 detik ke depan.
Mengapa memisahkan keduanya adalah sebuah terobosan?
Karena model-model lama (yang disebut di paper seperti Bayesian recursive state estimator ) gagal total karena mereka hanya melakukan Lapisan 2 (Prediksi Lintasan). Mereka melihat pejalan kaki dan pada dasarnya mengasumsikan dia akan terus berjalan lurus seperti robot. Begitu pejalan kaki itu tiba-tiba berubah pikiran, model itu hancur.
Paper ini menyatakan bahwa Lapisan 1 ("Prediksi Gerakan Dasar") harus menginformasikan Lapisan 2 ("Ramalan Lintasan").
Bayangkan skenario ini: Sistem melihat seorang pesepeda melambat.
Model Lama (Hanya Fisika): "Dia melambat. Data historis mengatakan 90% orang yang melambat akan berhenti. Prediksi saya: dia akan berhenti di tepi jalan."
Model Baru (Niat + Fisika): Lapisan 1 mendeteksi "lengan terangkat untuk memberi tanda belok". Sistem langsung berpikir, "Aha! Dia bukan berhenti, dia bersiap berbelok." Sistem kemudian mengabaikan model prediksi "berhenti" dan beralih ke model prediksi "berbelok".
Inilah lompatan besar dalam keandalan.
Di Dapur Para Insinyur: Cara Mereka Menggabungkan Gosip Digital Ini
Oke, jadi mobil, kamera, dan ponsel semuanya "berbisik" dalam jaringan. Tapi bagaimana "otak" kolektif mendengarkan semua gosip ini dan mengambil satu keputusan yang koheren? Ini adalah masalah fusi data.
Para peneliti mengusulkan arsitektur (di Gambar 3) yang memungkinkan dua strategi fusi yang berbeda (di Gambar 4). Saya akan menjelaskannya dengan analogi.
H3: Metode 1: 'Tim Detektif' (Feature-level Fusion)
Ini adalah sisi kiri dari Gambar 4 di paper.
Analogi: Bayangkan sebuah tim detektif yang menyelidiki sebuah kasus. Setiap "agen" (mobil, kamera) tidak membuat kesimpulan. Mereka hanya mengumpulkan petunjuk mentah (disebut "fitur").
Mobil: "Saya melihat bentuk kabur bergerak dengan kecepatan 10 km/jam."
Kamera: "Saya melihat warna merah dan dua lingkaran berputar (roda sepeda)."
Ponsel: "Saya mendeteksi guncangan dari akselerometer yang konsisten dengan 'mengayuh'."
Semua "fitur" mentah ini dikirim ke satu "detektif kepala" (sistem fusi pusat) yang melihat semua petunjuk bersama-sama dan baru membuat satu kesimpulan: "Itu adalah pesepeda yang sedang mengayuh."
Pro/Kontra: Ini berpotensi sangat akurat karena detektif kepala melihat gambaran lengkapnya. Tapi, ini sangat boros bandwidth (mengirim banyak data mentah) dan bisa jadi lambat.
H3: Metode 2: 'Panel Ahli' (Decision-level Fusion)
Ini adalah sisi kanan dari Gambar 4.
Analogi: Bayangkan sebuah panel ahli. Setiap "agen" adalah ahli yang cerdas. Mereka melihat semua data sendiri dan membuat kesimpulan mereka sendiri terlebih dahulu.
Mobil: "Setelah analisis saya, saya 80% yakin itu pesepeda yang akan lurus."
Kamera: "Saya 95% yakin itu pesepeda yang akan belok kiri."
Ponsel: "Saya 70% yakin itu pesepeda yang akan lurus."
Mereka lalu mengirimkan keputusan mereka (bukan data mentah) ke "moderator" (sistem fusi) yang pada dasarnya melakukan voting (mungkin dengan bobot, berdasarkan seberapa "yakin" si ahli) untuk membuat keputusan akhir.
Pro/Kontra: Ini jauh lebih cepat dan sangat hemat bandwidth (hanya mengirim pesan "80% yakin"). Tapi, ada risiko kehilangan nuansa penting yang ada di data mentah.
Bagian yang cerdas adalah paper ini tidak memilih satu. Arsitektur mereka dirancang untuk mendukung keduanya. Ini berarti sistem dapat beradaptasi. Dalam situasi lalu lintas yang sepi, ia bisa menggunakan "Tim Detektif" yang lambat tapi akurat. Di persimpangan yang kacau balau saat jam sibuk, ia bisa beralih ke "Panel Ahli" yang cepat untuk keputusan real-time.
Seluruh proses ini—mengambil data mentah (fitur), melatih model untuk mengenalinya (menggunakan teknik seperti Histogram of Oriented Gradients (HOG) , Support Vector Machines (SVMs), dan Artificial Neural Networks (ANNs) )—adalah inti dari Artificial Intelligence dan(https://diklatkerja.com/course/big-data-dan-artificial-intelligence). Ini adalah salah satu aplikasi dunia nyata paling keren dari konsep-konsep tersebut yang pernah saya baca.
Poin-Poin Penting yang Harus Anda Ingat (Versi Cepat)
Paper ini adalah proposal arsitektur, jadi tidak ada hasil bombastis seperti "62% lebih efisien". Fokusnya adalah pada visi dan inovasi metodologi.
🚀 Visinya Luar Biasa: Kita bergeser dari paradigma "mobil otonom tunggal" (setiap mobil adalah benteng yang berjuang sendiri) ke "ekosistem otonom kolaboratif" (setiap mobil, tiang lampu, dan pejalan kaki adalah rekan satu tim).
🧠 Inovasi Utamanya: Memecahkan masalah "oklusi" (titik buta) dengan sensor fusion. Mobil Anda tidak perlu melihat Anda untuk tahu Anda ada di sana, karena infrastruktur dan ponsel Anda sudah memberitahunya.
💡 Pelajaran Buat Saya: Solusi terbaik untuk masalah yang kompleks seringkali bukan satu agen super-pintar, tapi banyak agen "cukup pintar" yang mau berkolaborasi dan berbagi data. Itulah inti dari "Collective Intelligence".
🤯 Konsep Kunci: Memisahkan niat psikologis ("basic movement primitive") dari aksi fisik ("trajectory forecast"). Ini adalah kunci untuk prediksi yang benar-benar andal.
Sebuah Kritik Halus: Apa yang (Sengaja?) Dilewatkan oleh Paper Ini
Meskipun saya menyukai visi ini, ada beberapa hal yang membuat saya mengernyitkan dahi. Ini adalah pertanyaan-pertanyaan yang—menurut saya—tidak dijawab oleh paper ini.
H3: Masalah Kesenjangan Digital (The Digital Divide)
Seluruh arsitektur yang agung ini (digambarkan di Gambar 3) memiliki tiga pilar: Mobil, Infrastruktur, dan "Body" (sensor yang dipakai VRU). Pilar "Body" ini bergantung pada "VRU yang dilengkapi dengan perangkat pintar".
Mari kita pikirkan sejenak. Siapa VRU yang paling rentan di jalanan? Seringkali anak-anak yang berlari mengejar bola, lansia, atau tunawisma. Mereka adalah kelompok yang paling tidak mungkin membawa smartphone atau smartwatch terbaru yang menjalankan aplikasi pelacakan ini.
Apakah sistem ini secara tidak sengaja menciptakan "kasta" keselamatan di jalan? Di mana mereka yang kaya dan memiliki teknologi terbaru menjadi "terlihat" dan dilindungi oleh sistem, sementara mereka yang tidak mampu membelinya menjadi semakin tidak terlihat dan rentan? Paper ini tidak membahas bias sosio-ekonomi yang sangat nyata ini.
H3: Masalah Ketergantungan dan Akurasi
Paper ini dengan jujur mengakui di bagian akhir bahwa data dari sensor yang dipakai di tubuh (ponsel) "jauh kurang akurat mengenai penentuan posisi absolut" dibandingkan, katakanlah, video dari kamera infrastruktur.
Mereka lalu mengatakan ini tidak apa-apa karena (1) informasi yang tidak akurat pun lebih baik daripada tidak ada informasi sama sekali (terutama saat terhalang) dan (2) "sistem sensor di perangkat seluler akan terus ditingkatkan".
Alasan kedua itu, terus terang, adalah sedikit hand-waving—mengandalkan teknologi masa depan untuk memperbaiki masalah desain hari ini. Menggantungkan sistem keselamatan real-time yang kritis pada akurasi GPS ponsel yang terkenal buruk di "hutan kota" (dikelilingi gedung tinggi) terasa sangat berisiko bagi saya.
H3: Masalah Privasi dan Komunikasi
Mari kita bahas gajah di dalam ruangan. Smartphone saya akan terus-menerus menyiarkan "niat" saya—pergerakan dasar saya, ke mana saya melihat, prediksi ke mana saya akan melangkah—ke setiap mobil dan infrastruktur di sekitar saya?
Siapa yang memiliki data ini? Bagaimana data ini dianonimkan? Apa yang terjadi jika data ini diretas?
Secara teknis, paper ini hanya menyebutkan bahwa "strategi baru untuk jaringan ad hoc diusulkan". Ini adalah cara akademis untuk mengatakan, "Kami tahu ini masalah besar, tapi itu bukan fokus kami." Menciptakan jaringan on-the-fly yang stabil, aman, dan berlatensi sangat rendah antara puluhan agen yang bergerak (mobil, orang) di persimpangan yang kacau adalah tantangan teknik yang monumental. Paper ini mengidentifikasinya, tetapi tidak menyelesaikannya.
Dampak Nyata yang Bisa Saya Terapkan Hari Ini (Bukan Cuma di Mobil)
Anda mungkin tidak sedang membangun mobil otonom. Saya juga tidak. Tapi prinsip-prinsip dalam paper ini sangat relevan dengan cara kita bekerja setiap hari.
Pelajaran 1: Hancurkan Silo Data Anda. Mobil yang sendirian di paper ini adalah "silo". Ia buta terhadap apa yang tidak bisa dilihatnya. Di kantor Anda, tim sales adalah "silo". Tim marketing adalah "silo". Tim produk adalah "silo". Mereka semua memiliki "oklusi" (titik buta). Visi "Collective Intelligence" adalah tentang menciptakan fusi data. Bagaimana Anda bisa membuat data dari tim sales (umpan balik pelanggan) secara otomatis menginformasikan model tim marketing (target audiens)?
Pelajaran 2: Debat 'Feature' vs. 'Decision' di Rapat Anda. Ingat analogi 'Tim Detektif' (feature-level) vs. 'Panel Ahli' (decision-level)?. Ini terjadi di setiap rapat yang pernah Anda hadiri. Apakah Anda ingin tim Anda membawa "data mentah" (fitur) ke rapat untuk dianalisis bersama? (Ini lambat, tapi mendalam). Atau Anda ingin setiap anggota tim datang dengan "keputusan" mereka yang sudah matang dan Anda tinggal melakukan voting? (Ini cepat, tapi dangkal). Keduanya adalah strategi yang valid, dan paper ini mengajarkan kita untuk bersikap fleksibel tentang kapan menggunakan yang mana.
Mengelola semua bagian yang bergerak ini—data dari agen yang berbeda, tujuan yang saling bertentangan, timeline yang ketat, dan komunikasi antar tim—pada dasarnya adalah inti dari Project Management. Paper ini, pada intinya, adalah proposal untuk sistem manajemen proyek yang sangat canggih untuk keselamatan lalu lintas.
Bayangkan kembali "tarian" canggung di persimpangan yang saya ceritakan di awal.
Sekarang bayangkan ini: Anda melangkah ke tepi trotoar. Bahkan sebelum kaki Anda meninggalkan trotoar, sistem "Collective Intelligence" ini telah mendeteksi pergeseran postur dan arah pandangan Anda. Ia mengklasifikasikan "gerakan dasar" Anda sebagai 'akan-menyeberang'.
Secara instan, sistem ini memberi tahu setiap mobil dalam radius 100 meter bahwa niat Anda adalah 'akan-menyeberang'. Mobil yang mendekat tidak hanya "melihat" Anda sebagai objek. Ia memahami niat Anda. Tidak ada lagi tarian canggung. Tidak ada lagi ambiguitas.
Itu adalah dunia yang sedang dibangun oleh para peneliti ini. Ya, ini rumit. Ya, ini sedikit menyeramkan dari sisi privasi. Tapi ini juga sangat brilian.
Kalau kamu tertarik dengan ini, dan ingin ikut pusing-pusing seru bareng saya memikirkan detail teknisnya, coba baca paper aslinya. Ini bacaan yang padat, tapi sangat sepadan.
Teknologi
Dipublikasikan oleh Melchior Celtic pada 10 November 2025
Perlombaan menuju mobil otonom Level 5 (sepenuhnya tanpa pengemudi) telah menghabiskan miliaran dolar, namun paper ini menyoroti jurang pemisah antara ambisi teknologi dan kenyataan di lapangan.
Dua Pertanyaan Sederhana yang Menghantui Para Insinyur
Para peneliti merumuskan dua pertanyaan yang tampak sederhana namun implikasinya masif :
"Apa yang akan terjadi pada jalan kita jika mobil-mobil ini benar-benar ada di mana-mana?" (Apa dampak AV pada infrastruktur fisik?)
"Apa yang dibutuhkan mobil-mobil ini dari jalan kita agar tidak menabrak?" (Apa yang dibutuhkan AV dari infrastruktur untuk berkendara dengan aman?)
Pertanyaan ini menggeser beban. Selama ini kita bertanya, "Kapan Tesla akan cukup pintar?" Paper ini memaksa kita bertanya, "Kapan Departemen Pekerjaan Umum akan cukup siap?"
Yang Membuat Saya Terkejut: 13 Masalah yang Kita Anggap Remeh
Paper ini mengidentifikasi "tiga belas topik utama" infrastruktur fisik yang akan terdampak atau dibutuhkan oleh AV. Tiga belas!
Membacanya terasa seperti daftar periksa renovasi rumah yang tidak pernah Anda pikirkan. Anda ingin dapur baru yang canggih (mobil AV), tetapi paper ini datang dan memberi tahu Anda bahwa pondasi Anda retak (permukaan jalan), pipa Anda bocor (drainase), dan kabel Anda bisa terbakar (marka jalan).
Ketiga belas topik itu mencakup segalanya, mulai dari desain geometri jalan, marka jalan, rambu lalu lintas, permukaan aspal, persimpangan, jembatan, terowongan, hingga hal sepele seperti lampu jalan dan got.
Saya tidak akan membahas ketigabelasnya, tapi saya akan membagikan temuan-temuan paling mengejutkan yang membuat saya terdiam.
Perjalanan Menuruni "Lubang Kelinci" (Bagian 1: Jalan yang "Dapat Dibaca")
Kita lupa bahwa AV tidak melihat jalan seperti kita. Sensor mereka (kamera, Lidar) bukanlah mata manusia. Mereka adalah pembaca literal yang membutuhkan teks yang jelas, dan jalan kita saat ini penuh dengan "salah ketik".
Garis Putus-putus yang Menjadi Tali Penopang Hidup
Bayangkan Anda mengemudi di jalan yang marka lajurnya sudah pudar total. Anda mungkin akan sedikit melambat, tapi Anda masih bisa "menebak" di mana lajur Anda seharusnya berada berdasarkan lebar jalan atau alur kendaraan di depan.
AV tidak bisa "menebak".
Bagi sistem Lane Keeping Assist (LKA) yang ada di mobil kita saat ini (Level 1-2), marka jalan adalah "salah satu area penelitian paling menonjol" karena mereka sangat bergantung padanya untuk menentukan posisi. Paper ini menyoroti bahwa banyak kegagalan atau disengagements (saat AV menyerah dan meminta manusia mengambil alih) terjadi hanya karena marka jalan yang "buruk" atau "tidak konsisten".
Masalahnya diperparah oleh hal yang kita anggap remeh: drainase (Topik 12). Drainase yang buruk menyebabkan genangan air yang menutupi marka. Lebih buruk lagi, di malam hari, pantulan lampu depan dari permukaan jalan yang basah ("high-intensity reflections") dapat "membutakan" sensor kamera, membuat mobil Anda buta sesaat.
Pelajaran: Drainase buruk -> Jalan basah -> Marka tak terlihat & Sensor silau -> AV gagal berfungsi.
Membaca Rambu yang Dibuat untuk Mata Manusia
AV menggunakan computer vision untuk membaca rambu lalu lintas (Topik 5). Tapi teknologi ini, menurut paper tersebut, "belum mencapai level yang diinginkan." Sistem ini masih menderita "false positives" (melihat rambu "Stop" padahal itu adalah iklan di bus) dan "false negatives" (melewatkan rambu batas kecepatan).
Mengapa?
Variabilitas: Rambu di setiap negara (bahkan setiap kota) bisa berbeda bentuk, ukuran, atau warnanya. AI harus dilatih untuk setiap variasi.
Rambu Digital (VMS): Rambu pesan elektronik di jalan tol seringkali sulit dibaca oleh kamera karena refresh rate dan teknologinya dirancang untuk mata manusia, bukan lensa kamera.
Data yang paling mengejutkan: sebuah studi di Kroasia menemukan bahwa computer vision gagal mendeteksi 25% rambu kecepatan di jalan raya terpisah (divided roads). Bayangkan seperempat rambu batas kecepatan tidak terlihat oleh mobil Anda.
Cahaya, Cahaya, dan "Kebisingan" Sisi Jalan
Ini bukan hanya tentang apa yang bisa dilihat, tapi seberapa jelas. Paper ini mengutip studi (Ye et al., 2021) yang menemukan bahwa kecelakaan AV di "pencahayaan buruk, bahkan dengan lampu jalan menyala" (Topik 11) menghasilkan "jumlah korban yang jauh lebih tinggi".
Dan bukan hanya cahaya, tapi juga "kekacauan" visual. Bagi kita, pohon, semak, tempat sampah, dan halte bus (Topik 10) adalah latar belakang. Bagi AI, itu semua adalah "kebisingan" (noise). Paper itu menyatakan, "Semakin banyak objek seperti itu berarti lingkungan semakin kompleks" bagi AV untuk mengidentifikasi mana ancaman nyata (anak kecil berlari) dan mana yang bukan (daun berguguran).
Implikasinya? Kita mungkin perlu "membersihkan" dan menyederhanakan lanskap kota kita hanya agar robot bisa bernavigasi.
Perjalanan (Bagian 2: Desain Fisik Jalan Kita)
Jika Bagian 1 adalah tentang bagaimana AV melihat, bagian ini adalah tentang bagaimana mereka merasakan dan berinteraksi dengan desain fisik jalan.
Ironi Presisi: Saat Mobil Pintar Merusak Jalannya Sendiri
Ini adalah temuan favorit saya, karena sangat ironis.
Coba perhatikan cara Anda mengemudi. Anda tidak pernah mengemudi di garis lurus yang sempurna di tengah lajur. Anda secara alami sedikit melayang ke kiri dan ke kanan. Ini disebut "wheel wander" (jejak roda yang berkelana).
Ternyata, ketidaksempurnaan manusia ini baik untuk jalan. Itu menyebarkan beban kendaraan ke seluruh permukaan aspal, membuatnya lebih awet.
Masalahnya? AV (Topik 3) terlalu presisi. Mereka melacak di tepat tengah lajur, atau di jalur yang sama persis setiap saat. Ini menciptakan "beban berulang di titik yang sama" yang menyebabkan kelelahan material dan rutting (pembentukan alur di jalan) yang dipercepat.
Satu studi (Zhou et al., 2019) yang dikutip paper ini memperkirakan bahwa presisi AV dapat "mempersingkat umur kelelahan perkerasan hingga 22% dan meningkatkan kedalaman alur hingga 30%".
Solusi yang dibahas di paper ini? Sebuah paradoks indah: kita mungkin harus memprogram AV untuk "berkeliaran secara merata" di lajur—pada dasarnya, memprogram mereka untuk meniru ketidaksempurnaan manusia agar jalan kita selamat.
Geometri Jalan yang Dibuat untuk Nenek, Bukan untuk Robot
Desain jalan kita saat ini (Topik 1)—seberapa tajam tikungan, seberapa curam bukit—didasarkan pada satu hal: Perception-Reaction Time (PRT) manusia. Rata-rata, kita butuh sekitar 2,5 detik untuk melihat bahaya dan menginjak rem.
AV memiliki PRT super cepat (misalnya, 0,5 detik). Ini berarti Stopping Sight Distance (SSD) mereka jauh lebih pendek. Secara teori, ini adalah peluang: kita bisa membangun jalan baru di masa depan dengan tikungan lebih tajam dan tanjakan lebih curam, menghemat miliaran biaya konstruksi dan pembebasan lahan.
Namun, untuk jalan yang sudah ada, desain lama ini justru berbahaya. Tikungan horizontal yang tajam dan puncak bukit (vertical crest curves) adalah mimpi buruk bagi AV Level 2 saat ini. Sensor mereka tidak bisa "melihat menembus" bukit atau "melihat mengitari" tikungan. Paper ini mencatat bahwa fungsi driver-assist seringkali mati mendadak (disengaged) di situasi ini, membuat pengemudi terkejut.
Lajur yang Menyempit dan Bahu Jalan yang Tiba-tiba Menjadi Krusial
Ini adalah temuan lain yang berlawanan dengan intuisi saya.
Mitos: AV sangat presisi, jadi kita bisa membuat "lebar lajur yang lebih sempit" (Topik 2).
Realitas: Ide ini populer. Bayangkan, kita bisa "memuat lajur tambahan" di jalan tol yang ada tanpa konstruksi baru. Di kota, ruang ekstra bisa untuk jalur sepeda. TETAPI, tes pada AV Level 2 saat ini menunjukkan sistem LKA cenderung gagal di lajur sempit (di bawah 2,75 meter). Ditambah lagi, "stabilitas posisi" setiap merek mobil sangat bervariasi.
Mitos: AV sangat aman, jadi kita tidak perlu bahu jalan.
Realitas: Paper ini berargumen bahwa bahu jalan akan "lebih dibutuhkan dari sebelumnya".
Mengapa? Untuk AV Level 3-4, ada konsep Operational Design Domain (ODD)—semacam "zona nyaman" di mana AV dirancang untuk bekerja (misalnya, jalan tol, cuaca cerah). Jika mobil menghadapi situasi di luar ODD—seperti badai salju mendadak atau zona konstruksi—ia harus menyerahkan kembali kendali ke manusia. Jika manusia tidak merespons (mungkin sedang tidur), mobil memerlukan "safe harbour" (pelabuhan aman) untuk berhenti darurat. Bahu jalan adalah pelabuhan itu.
Ini berarti kita mungkin perlu menambah tempat pemberhentian darurat, terutama di jembatan atau terowongan yang tidak memiliki bahu jalan. Ini adalah tantangan Manajemen Infrastruktur yang masif.
Perjalanan (Bagian 3: Kekacauan Manusiawi di Persimpangan)
Ini adalah bagian tersulit. Di sinilah logika biner AI bertemu dengan kekacauan tak terduga dari perilaku manusia dan struktur warisan.
Struktur Raksasa: Saat Iring-iringan Truk Pintar Menghancurkan Jembatan Tua
Platooning (iring-iringan) truk otonom adalah fitur efisiensi bahan bakar yang hebat. Tapi itu adalah mimpi buruk bagi insinyur sipil (Topik 8).
Desain jembatan saat ini mengasumsikan beban terdistribusi (kendaraan acak, menyebar). Platooning menciptakan beban terkonsentrasi yang ekstrem—beberapa truk super berat, berdekatan, tanpa "wheel wander"—yang "tidak dipertimbangkan" oleh standar desain jembatan saat ini.
Implikasinya? Jembatan bentang panjang yang ada mungkin perlu "dihitung ulang secara struktural" atau bahkan "diperkuat". Di terowongan, masalahnya beda lagi: sinyal satelit (GPS) hilang, membuat penentuan posisi sulit, dan perubahan pencahayaan yang cepat di pintu masuk/keluar dapat "membutakan" sensor kamera.
Anarki Bundaran yang Ditakuti AI
Persimpangan (Topik 6) adalah "situasi lalu lintas yang kompleks" dan mewakili "kemacetan". Ironisnya, di sinilah kecelakaan AV paling sering terjadi. Sebuah studi (Favarò et al., 2017) menemukan bahwa 89% kecelakaan AV yang dilaporkan (kebanyakan tabrakan dari belakang oleh manusia) terjadi di persimpangan.
Para ahli terpecah. Beberapa percaya AV akan membuat bundaran lebih efisien. Namun, paper ini menyoroti bahwa persimpangan bersinyal (lampu merah/hijau) mungkin "lebih mudah ditangani oleh AV" karena lebih "deterministik" (perintah berhenti/jalan yang dapat diprediksi).
Bundaran membutuhkan "negosiasi" sosial—kontak mata, anggukan kepala, membaca bahasa tubuh—yang sangat manusiawi. Algoritma lebih menyukai perintah biner "merah" atau "hijau".
Tantangan Terbesar: Kita (Pejalan Kaki)
Dan inilah hambatan terbesar: kita. Vulnerable Road Users (VRUs)—pejalan kaki, pengendara sepeda (Topik 9)—disebut sebagai "hambatan terbesar" bagi sistem penghindaran tabrakan.
Masalahnya dua:
Deteksi: Paper ini mengutip studi (Combs et al., 2019) yang menemukan bahwa kamera saja (opsi termurah) hanya dapat mencegah <30% kematian pejalan kaki. Hanya kombinasi mahal (Kamera + Lidar + Radar) yang bisa mencapai >90%.
Interaksi: Bagaimana AV berinteraksi dengan kita? Paper ini mengusulkan solusi radikal: mengganti zebra cross (yang ambigu dan butuh negosiasi) dengan perlintasan bersinyal (lampu pejalan kaki) yang "jauh lebih deterministik" untuk AV.
Ini adalah poin besar. Kita mungkin harus mengubah tatanan kota kita—membuatnya kurang cair dan kurang spontan—hanya untuk mengakomodasi robot.
Ironi Parkir Valet Otonom yang Tidak Menemukan Sinyal
Terakhir, Automated Valet Parking (AVP) (Topik 7) terdengar hebat. Mobil mengantar Anda dan parkir sendiri.
Masalahnya? Sebagian besar tempat parkir (terutama di perkotaan) ada di bawah tanah, di mana "sinyal GPS tidak kuat." Selain itu, tempat parkir ini sering dioperasikan secara pribadi dan "tidak menggunakan marka jalan standar," yang membingungkan sensor.
Paper ini memprediksi kita tidak akan menghilangkan parkir, tapi memindahkannya. Kita akan membutuhkan "area pemuatan di tepi jalan yang diperluas" untuk pick-up dan drop-off (PUDO). Ruang tepi jalan akan menjadi komoditas yang "semakin berharga".
Opini Pribadi Saya: Kita Tidak Hanya Membutuhkan Mobil yang Lebih Pintar
Membaca 13 topik ini seperti disiram air dingin. Paper ini, bagi saya, adalah dakwaan senyap terhadap mentalitas "Silicon Valley-sentris" dalam pengembangan AV. Para raksasa teknologi berlomba-lomba membuat AI yang sempurna, dengan asumsi dunia adalah lingkungan yang steril dan sempurna seperti di sandbox simulasi mereka.
Kenyataannya, dunia nyata berantakan. Catnya pudar (Topik 4), aspalnya berlubang (Topik 3), drainasenya buruk (Topik 12), dan rambunya tertutup pohon (Topik 10).
Meski temuannya hebat, paper ini (sebagai review) hanya bisa merangkum masalah. Saya masih penasaran dengan solusi birokrasinya. Paper ini menyoroti (di bagian Kesimpulan) bahwa industri teknologi "seringkali enggan untuk berbagi apa yang mereka harapkan dari infrastruktur jalan" karena mereka "dalam persaingan serius".
Ini gila.
Jadi, Departemen PU (disebut IOOs dalam paper) dibiarkan menebak-nebak. Standar apa yang harus mereka gunakan untuk mengecat marka? Seberapa terang lampu yang dibutuhkan? Haruskah mereka membangun bahu jalan atau lajur sempit? Kekacauan komunikasi ini adalah penghalang terbesar, bukan teknologinya.
Paper ini ditutup dengan peringatan tentang "equity gap" (kesenjangan keadilan). Jika kita tidak hati-hati, AV mungkin hanya akan berfungsi di lingkungan kaya yang baru dibangun dan terawat baik, sementara gagal di pusat kota yang lebih tua atau jalan pedesaan. Ini adalah resep untuk apartheid mobilitas.
🚀 Hasilnya luar biasa: Paper ini membuktikan bahwa AV membutuhkan jalan yang dirawat dengan standar jauh lebih tinggi dari yang kita miliki saat ini.
🧠 Inovasinya: Mengalihkan fokus dari AI di dalam mobil ke kualitas aspal, cat, dan drainase di luar mobil.
💡 Pelajaran: Kita perlu berhenti bertanya, "Kapan mobil self-driving siap?" dan mulai bertanya, "Kapan jalan kita siap untuk mereka?".
Jadi, Apa yang Bisa Saya Terapkan Hari Ini?
Jika Anda berpikir ini semua adalah masalah masa depan, Anda salah.
Masalah-masalah ini sudah terjadi sekarang. Sistem LKA dan driver-assist (Level 1-2) di mobil baru Anda sudah menghadapi masalah marka jalan yang pudar dan desain tikungan yang membingungkan. Ini adalah masalah Keselamatan Infrastruktur Jalan saat ini, bukan besok.
Tapi ada harapan, dan itu datang dari tempat yang tidak terduga.
Paper ini menyoroti (Topik 13) bahwa AV di masa depan dapat menjadi alat perawatan jalan terbaik. Bayangkan: setiap mobil di jalan adalah inspektur jalan. Sensor mereka (kamera, lidar) dapat "mengumpulkan data inventaris dan kondisi" jalan—retakan, lubang, marka pudar—secara real-time dan mengirimkannya ke otoritas.
Ini dapat merevolusi Manajemen Infrastruktur. Alih-alih survei manual yang lambat dan mahal, kita bisa mendapatkan peta panas real-time tentang di mana perbaikan paling dibutuhkan.
Tentu saja, ini menimbulkan pertanyaan baru: Siapa yang memiliki data itu? Bagaimana kita mengelola big data ini?.
Pada akhirnya, paper ini meyakinkan saya akan satu hal: revolusi AV tidak akan dimenangkan oleh pembuat kode di Silicon Valley saja. Ini membutuhkan generasi baru insinyur sipil yang memahami(https://www.diklatkerja.com/course/teknik-jalan/) dan computer vision, serta manajer aset yang memahami big data sama baiknya dengan mereka memahami campuran aspal.
Jalan pulang saya mungkin masih akan macet untuk waktu yang lama. Tapi setidaknya sekarang saya tahu mengapa.
Kalau kamu tertarik dengan "dapur" dari semua masalah ini—dan ini benar-benar menarik—coba baca paper aslinya.