Physics of Failure Modeling

Meningkatkan Keandalan Kipas Pendingin Elektronik: Optimalisasi Accelerated Lifetime Testing Berdasarkan Standar IPC-9591

Dipublikasikan oleh Dewi Sulistiowati pada 11 April 2025


Latar Belakang: Mengapa ALT Itu Penting?

Dalam dunia elektronika industri, kipas pendingin memegang peran vital menjaga suhu perangkat tetap stabil. Jika komponen ini gagal, maka sistem elektronik berisiko overheating, bahkan dapat menyebabkan kerusakan total pada perangkat. Oleh karena itu, uji keandalan kipas — khususnya menggunakan metode Accelerated Lifetime Testing (ALT) — menjadi bagian krusial dalam proses validasi desain dan kualitas produksi.

Penelitian oleh Anton Yatskiv dari Tallinn University of Technology menyajikan proyek nyata yang fokus pada peningkatan prosedur dan pengaturan ALT untuk kipas pendingin yang digunakan di produk electrical drive. Studi ini menjadi contoh aplikatif bagaimana perusahaan dapat mengintegrasikan standar industri dan praktik terbaik untuk meningkatkan akurasi pengujian dan kualitas produk akhir.

Tujuan dan Konteks Proyek

Studi ini dilakukan di Estonia, bekerja sama dengan tim Reliability Engineering dari sebuah perusahaan elektronik internasional. Fokus utama adalah:

  • Menguji ulang prosedur ALT untuk kipas pendingin pada level komponen.
  • Membandingkan metode internal dengan standar industri, khususnya IPC-9591.
  • Mengidentifikasi dan mengimplementasikan perbaikan baik pada sisi perangkat keras maupun perangkat lunak sistem pengujian.

Komponen Kritis dalam Sistem Elektrikal: Posisi Kipas

Dalam sistem electrical drive, kipas bukan sekadar aksesoris tambahan. Ia bertugas mendinginkan berbagai blok kritis: dari power supply, konverter daya, hingga unit kontrol mikro. Jika pendinginan tidak optimal, komponen internal seperti motor, sensor, dan PCB bisa cepat aus atau rusak.

Standar IPC-9591 dan Tolok Ukur ALT

Penelitian ini menjadikan IPC-9591 sebagai acuan utama karena standar ini secara eksplisit mengatur metode pengujian dan parameter evaluasi untuk kipas yang digunakan dalam peralatan elektronik konsumen dan industri.

Parameter yang Diuji Berdasarkan IPC-9591:

  • Penurunan kecepatan rotasi ≥15%
  • Kenaikan konsumsi arus ≥15%
  • Kenaikan kebisingan >3 dB
  • Gangguan pada interface elektronik
  • Keretakan fisik dan kebocoran pelumas
  • Perubahan arah dan orientasi kipas selama pengujian

Studi Kasus: Sebelum dan Sesudah Perbaikan Prosedur Pengujian

Sebelum Perbaikan:

  • Pengukuran hanya dilakukan untuk arus; kecepatan dan kebisingan tidak diukur.
  • Tidak ada kontrol otomatisasi start/stop sesuai siklus.
  • Tegangan suplai tetap dan tidak divariasikan sebagai faktor percepatan.

Setelah Perbaikan:

  • Penambahan unit data logger untuk pencatatan arus dan kecepatan secara terus-menerus.
  • Peningkatan kontrol suhu melalui sistem cooling fan otomatis.
  • Implementasi Power Supply terpisah untuk DUT (Device Under Test).
  • Penggunaan relay timer untuk siklus hidup-mati sesuai standar.
  • Penyusunan ulang orientasi kipas agar memenuhi uji semua posisi operasional (atas, bawah, kanan, kiri).

Estimasi Umur: Menerapkan Konsep L10 & Faktor Percepatan

Faktor Percepatan Suhu:

  • Mengacu pada standar IPC-9591: 1,5× untuk setiap kenaikan 10°C.
  • Dalam praktiknya, perusahaan juga mempertimbangkan faktor tambahan seperti kelembapan, debu, dan tegangan berlebih.

Simulasi Umur:

Misalnya:

  • Suhu operasi harian = 50°C
  • Suhu pengujian = 85°C
  • Dengan asumsi pengujian berjalan 1000 jam, maka:
    • AF (Acceleration Factor) = (1.5)^((85–50)/10) = 1.5^3.5 ≈ 5.2
    • Umur estimasi di lapangan = 1000 jam × 5.2 = 5200 jam

Analisis Kegagalan: FMEA Kipas Pendingin

Berdasarkan analisis dari 40+ unit pengujian, ditemukan kegagalan berikut:

Komponen Mekanis:

  • Bearing aus atau macet akibat degradasi pelumas → penyebab utama kelebihan arus.
  • Balancing rotor tidak sempurna → menghasilkan getaran tinggi dan keretakan blade.
  • Aging pada lem stator → menyebabkan dislokasi kumparan.

Komponen Elektrikal:

  • PCB rusak karena kelembapan → dendritic growth memicu short circuit.
  • Solder joints retak karena siklus panas-dingin berulang.
  • Insulasi kawat mengelupas → menyebabkan hubungan singkat internal.

FMEA yang digunakan menggabungkan literatur, hasil pengujian nyata, dan standar MIL-HDBK-217 untuk evaluasi MTTF.

Perbandingan dengan Vendor Lain

Beberapa vendor kipas sudah melakukan pengujian berbasis IPC-9591, tetapi:

  • Frekuensi pengukuran tidak konsisten.
  • Variasi pengukuran akustik dan arus antar vendor tinggi.
  • Tidak semua vendor mengintegrasikan faktor akselerasi selain suhu.

Dengan penguatan prosedur internal, Electronics Company dapat memverifikasi data vendor dan meningkatkan akurasi prediksi keandalan produk final.

Potensi Perbaikan Jangka Panjang

  1. Otomatisasi penuh dengan microcontroller/PLC.
  2. Integrasi pengukuran getaran, tekanan, dan kebisingan secara kontinu.
  3. Pembuatan sistem korelasi antara data pengujian laboratorium dengan data kerusakan lapangan.
  4. Pemanfaatan Machine Learning untuk prediksi kerusakan dini.
  5. Perluasan ke tipe komponen lain seperti sensor, relay, atau inverter cooling.

Dampak Bisnis & Industri

Peningkatan sistem ALT seperti dalam studi ini memungkinkan:

  • Penurunan biaya jaminan dan pengembalian produk.
  • Peningkatan kepercayaan konsumen terhadap keandalan produk.
  • Validasi vendor baru lebih cepat dan efisien.

Studi ini juga bisa menjadi referensi utama dalam pengembangan modul pembelajaran teknik keandalan, konten bootcamp QC, dan materi pelatihan industri 4.0.

Kesimpulan: ALT yang Cerdas, Produk yang Tahan Lama

Melalui pendekatan berbasis standar, data, dan logika rekayasa, proyek ALT kipas pendingin ini berhasil menunjukkan:

  • Pentingnya desain pengujian yang komprehensif
  • Efektivitas pengukuran kontinu dan otomatisasi
  • Relevansi langsung ke kualitas produk akhir dan efisiensi bisnis

Studi ini menjadi template konkret bagaimana perusahaan bisa mengubah pengujian dari sekadar formalitas menjadi alat strategis untuk peningkatan kualitas.

Referensi : Yatskiv, Anton. Improvement of electronics cooling fans’ ALT testing project. Master's Thesis, Tallinn University of Technology, School of Information Technologies, 2022.

Selengkapnya
Meningkatkan Keandalan Kipas Pendingin Elektronik: Optimalisasi Accelerated Lifetime Testing Berdasarkan Standar IPC-9591

Physics of Failure Modeling

Menaklukkan Lingkungan Ekstrem: Prediksi Masa Pakai Elektronik Pengeboran dengan Pendekatan Probabilistik dan Data Lapangan

Dipublikasikan oleh Dewi Sulistiowati pada 11 April 2025


Pendahuluan: Kebutuhan Prediksi Keandalan di Bawah Tanah

Di dunia pengeboran minyak dan gas, kegagalan alat elektronik bawah tanah (downhole electronics) tidak hanya mahal, tapi juga berisiko tinggi terhadap keselamatan dan efisiensi operasi. Temperatur di atas 150°C, getaran >15g, dan tekanan ekstrem menjadi tantangan utama dalam mempertahankan performa Printed Circuit Board Assemblies (PCBAs) di Bottomhole Assembly (BHA).

Makalah ini menghadirkan pendekatan baru untuk prediksi keandalan sistem elektronik dalam pengeboran menggunakan kombinasi data operasional, sejarah pemeliharaan, serta model statistik dan Bayesian dalam kerangka probabilistik. Penelitian ini dilakukan oleh tim Baker Hughes dan menjadi pendekatan sistematik pertama yang menyatukan semua elemen data lapangan dan metode prediksi berbasis probabilitas.

Masalah Klasik dan Solusinya

Kendala utama dalam prediksi umur elektronik pengeboran:

  • Variabel stres tidak dapat diukur langsung.
  • Banyak mekanisme degradasi tidak diketahui secara real-time.
  • Data lapangan penuh noise, human error, dan distribusi tak normal.
  • Accelerated life test (HALT/HAST) tidak selalu mencerminkan kondisi nyata.

Solusi yang diusulkan:

  • Gunakan model probabilistik dengan parameter distribusi, bukan nilai tetap.
  • Terapkan Bayesian updating untuk menggabungkan data setiap misi pengeboran secara dinamis.
  • Gunakan IRMLE (Iteratively Reweighted Maximum Likelihood Estimation) untuk mendeteksi outlier dan mengoptimasi akurasi model.

Komponen yang Diteliti: Sistem AutoTrakG3

Fokus utama studi ini adalah pada modem catu daya tegangan rendah (LVPS) dari sistem AutoTrakG3, terdiri dari:

  • AutoTrak Steering System (ASS)
  • OnTrak Sensor Assembly (MWD & LWD)
  • Bidirectional Communication and Power Module (BCPM)

Semua modul tersebut memiliki komponen elektronik kritis yang rentan terhadap kegagalan akibat temperatur, getaran lateral, dan torsional (stick-slip).

Data Operasional Nyata: Platform MaPS™

Baker Hughes menggunakan MaPS™ (Maintenance and Performance System) sebagai basis data real-time untuk memantau:

  • Temperatur operasi, getaran, kecepatan rotasi
  • Riwayat misi dan jam pengeboran
  • Status gagal, diperbaiki, ditingkatkan atau pensiun

Metodologi: Prediksi Umur dengan IRMLE & Bayesian Update

Langkah-langkah Analisis:

  1. Pengelompokan data berdasarkan 3 flag:
    • Revisi, Perbaikan, dan Upgrade.
    • Contoh bucket: [“A”, N, Y] → tidak diperbaiki, telah di-upgrade ke revisi A.
  2. Estimasi parameter model:
    • Model Weibull, lognormal, atau eksponensial digunakan.
    • Fungsi karakteristik hidup berbasis temperatur, vibrasi lateral, dan torsional.
  3. Deteksi outlier:
    • Bobot setiap titik data diturunkan jika memiliki likelihood rendah.
    • Model dimutakhirkan hingga hasil stabil (toleransi 10⁻⁶).
  4. Seleksi model terbaik:
    • Berdasarkan PRESS score dan confidence parameter α.
    • Tiga model kompetitor: M1, M2, M3 (lihat tabel berikut).

Model Weibull Terbaik untuk LVPS

Analisis terhadap tiga model Weibull (M1, M2, dan M3) untuk sistem Low Voltage Power Supply (LVPS) menunjukkan bahwa Model M2 memiliki probabilitas posterior tertinggi (P(Mi) = 0.40), mengindikasikan performa terbaik dibandingkan model lainnya. Parameter skala dasar (α₀) menunjukkan tren peningkatan dari M1 ke M3, dengan nilai log-mean berkisar antara 7.5 hingga 8.6. Model M2 memperhitungkan efek suhu (T) secara signifikan dengan estimasi parameter α₁ = –10.3 dan deviasi standar 0.7, sementara model M3 menambahkan interaksi suhu dan lokasi (S×L) sebagai variabel penting (α₂ = –43.8, σ = 3.1). Hanya model M1 yang mempertimbangkan interaksi T×L (α₃ = –39.3, σ = 2.5). Sementara itu, parameter bentuk β memperlihatkan peningkatan bertahap dari M1 ke M3, yang mencerminkan perubahan karakteristik kegagalan dari lebih acak ke pola kegagalan yang lebih sistematis. Dengan mempertimbangkan faktor-faktor ini, Model M2 dinilai paling seimbang antara kesederhanaan dan akurasi prediksi untuk keandalan LVPS.

Studi Kasus Prediksi Umur: 19 Misi Pengeboran

Studi kasus pada 19 misi pengeboran untuk satu unit LVPS menunjukkan efektivitas tinggi dari model prediktif berbasis Bayesian update dalam memproyeksikan risiko kegagalan. Dengan memanfaatkan data lingkungan seperti temperatur, gaya lateral, stick-slip, dan jam pengeboran, model berhasil menghitung probabilitas kegagalan kumulatif untuk setiap run. Hasilnya, risiko tetap rendah pada sebagian besar run awal, namun meningkat tajam pada run ke-17 (0.85) dan ke-19 (0.87). Menariknya, model memprediksi bahwa kegagalan akan terjadi setelah run ke-18, dan alat memang benar-benar mengalami kegagalan pada run ke-19. Hal ini menunjukkan bahwa pendekatan prediktif yang digunakan sangat akurat dan mampu memberikan peringatan dini terhadap risiko kegagalan di lapangan.

Visualisasi Prediksi Life Expectancy

Grafik prediksi sisa umur (Remaining Useful Life/RUL) menunjukkan:

  • Rentang kepercayaan 95% mencakup nilai aktual.
  • Setelah run ke-17, prediksi menunjukkan risiko tinggi dan alat seharusnya pensiun sebelum run ke-19.

Keunggulan Pendekatan Ini

1. Akurasi Lebih Tinggi:

Memadukan data real-time, riwayat perawatan, dan stres lingkungan.

2. Adaptif:

Model diperbarui setelah tiap misi pengeboran, cocok untuk perawatan berbasis kondisi.

3. Deteksi Dini:

Mendeteksi komponen berisiko tinggi sebelum terjadi kegagalan aktual.

4. Efisiensi Biaya Perawatan:

Model memungkinkan penyesuaian strategi perawatan: cepat, parsial, atau penuh.

Kritik & Tantangan

Tantangan teknis:

  • Butuh database historis yang terstruktur (seperti MaPS™).
  • Perlu sumber daya analitik dan pemahaman teknik mendalam.

Tantangan implementasi:

  • Validasi dan integrasi ke sistem manajemen pemeliharaan eksisting.
  • Pelatihan tenaga kerja dan teknisi untuk memanfaatkan output model.

Kesimpulan: Jalan Menuju Prediksi Keandalan yang Andal

Dengan menggabungkan pendekatan probabilistik, Bayesian inference, dan data real-world dari operasi pengeboran, makalah ini menyajikan metode prediktif praktis dan teruji untuk memperkirakan masa pakai elektronik dalam kondisi ekstrem. Pendekatan ini membawa industri pengeboran lebih dekat ke prognostik presisi tinggi yang dapat menekan downtime, mencegah kegagalan, dan menghemat biaya jutaan dolar.

Di masa depan, sistem ini berpotensi menjadi bagian dari digital twin untuk monitoring berkelanjutan dan otomatis.

Sumber : Amit A. Kale, Katrina Carter-Journet, Troy A. Falgout, Ludger Heuermann-Kuehn, Derick Zurcher. A Probabilistic Approach for Reliability and Life Prediction of Electronics in Drilling and Evaluation Tools. Annual Conference of the Prognostics and Health Management Society, 2014.

Selengkapnya
Menaklukkan Lingkungan Ekstrem: Prediksi Masa Pakai Elektronik Pengeboran dengan Pendekatan Probabilistik dan Data Lapangan

Physics of Failure Modeling

Membangun Keandalan Sistem Lewat Fisika Kegagalan: Terobosan Baru dalam Analisis Risiko

Dipublikasikan oleh Dewi Sulistiowati pada 11 April 2025


Mengapa Kita Perlu Ubah Cara Pandang terhadap Common Cause Failure?

Common Cause Failures (CCFs) atau kegagalan sebab sama adalah mimpi buruk dalam sistem teknis modern, terutama di bidang energi nuklir, penerbangan, dan manufaktur kritis. Selama puluhan tahun, Probabilistic Risk Analysis (PRA) mengandalkan pendekatan statistik historis untuk memperkirakan risiko akibat CCF, namun pendekatan ini punya kelemahan besar: tidak menjelaskan penyebab fisik kegagalan.

Dalam artikel revolusioner ini, Mohaghegh, Modarres, dan Christou dari University of Maryland mengusulkan pendekatan baru: menggabungkan model Physics-of-Failure (POF) ke dalam PRA. Tujuannya jelas—mengubah PRA dari reaktif menjadi proaktif dengan mendeteksi dan memahami interaksi kegagalan sejak level material.

Apa Itu Physics-Based CCF Modeling?

Masalah dalam PRA Tradisional:

  • Parametrik dan bergantung pada data historis.
  • Tidak bisa menjelaskan interaksi antar kegagalan (seperti wear dan fatigue).
  • Sulit diaplikasikan ke sistem baru yang belum punya riwayat kegagalan.

Solusi yang Ditawarkan:

Physics-based CCF modeling memadukan:

  • Model probabilistik wear & fatigue dari level material ke sistem.
  • Causal modeling & Bayesian updating untuk memperhitungkan ketidakpastian dan hubungan sebab-akibat.
  • Finite Element Analysis (FEA) untuk memetakan interaksi kompleks antar kegagalan.

Studi Kasus Ilustratif: Wear & Fatigue di Komponen A1 dan B2

Penulis menggunakan contoh dua komponen:

  • B2 gagal karena wear.
  • A1 gagal karena kombinasi wear dan fatigue.

Keduanya berada dalam lingkungan kerja yang sama: suhu, tekanan, gesekan, desain geometri—faktor-faktor ini menjadi penyebab kegagalan terhubung (dependent failures).

Tahapan Model:

  1. Wear Model untuk B2
    Formula wear mengikuti hubungan gaya gesek, tegangan geser, dan viskositas pelumas:Nf−B2=K1(τypτmax)n1N_{f-B2} = K_1 \left(\frac{\tau_{yp}}{\tau_{max}}\right)^{n_1}Di mana τ\tau bergantung pada suhu, tekanan, geometri, dan gaya gesek.
  2. Interaksi Wear-Fatigue untuk A1
    Menggunakan pendekatan:
    • Damage-based: akumulasi kerusakan dari wear → mengubah stress → memicu fatigue.
    • Crack-based: model inisiasi dan propagasi retak akibat wear & fatigue.
  3. Konversi ke Model Probabilistik
    Dengan Bayesian inference, parameter seperti konstanta wear (K1,n1K_1, n_1) diubah menjadi distribusi probabilitas berdasarkan data uji.
  4. Causal Modeling
    Model kausal dibentuk untuk menunjukkan bagaimana faktor lingkungan (misalnya suhu, gaya, viskositas) memengaruhi keausan dan kelelahan komponen. Ini memungkinkan integrasi langsung ke PRA.

Kelebihan Paradigma Baru Ini

➕ Apa yang Membuatnya Unggul?

  • Tidak perlu data historis yang lengkap: sangat cocok untuk sistem baru.
  • Lebih realistis: mempertimbangkan lingkungan nyata dan desain aktual.
  • Cocok untuk PRA generasi baru: seperti reactor modular kecil (SMR), sistem otonom, dan infrastruktur energi terbarukan.

➕ Manfaat Aplikatif:

  • Menentukan interval perawatan optimal.
  • Mendeteksi potensi kegagalan besar dari interaksi kecil.
  • Menilai ketahanan sistem pasca-accident (seperti di pembangkit nuklir).
  • Menekan biaya perawatan dan downtime.

Tantangan yang Harus Dihadapi

  • Model FEA masih deterministik: perlu dikembangkan versi probabilistiknya.
  • Validasi data lapangan masih terbatas.
  • Kesulitan ekspansi dari material-level ke sistem-level.

Namun penulis telah mengusulkan solusi seperti:

  • Penggunaan Bayesian Belief Network (BBN) untuk menghubungkan model FE ke PRA sistem.
  • Agent-based modeling sebagai teknik untuk menyimpan dan menyebarkan data antar level komponen.

Perbandingan dengan Pendekatan Sebelumnya

Pendekatan prediktif berbasis physics-based cumulative damage modeling (CCF) menawarkan keunggulan signifikan dibandingkan metode parametrik tradisional. Sementara pendekatan tradisional sangat bergantung pada data historis kegagalan dan cenderung menghasilkan prediksi makro yang umum, model berbasis fisika mengandalkan teori mekanika dan eksperimen untuk membangun prediksi yang lebih spesifik dan mendetail hingga level komponen. Hal ini membuat pendekatan CCF jauh lebih relevan untuk sistem atau desain baru, yang belum memiliki banyak data historis. Selain itu, model CCF bersifat dinamis dan kausal, memungkinkan penyesuaian terhadap variasi kondisi lingkungan dan operasional secara real-time, berbeda dengan model parametrik yang statis dan kurang fleksibel. Dengan demikian, physics-based CCF memberikan fondasi yang lebih kuat dan adaptif untuk prediksi umur pakai dan manajemen keandalan produk teknik modern.

Relevansi terhadap Industri & Edukasi

Industri Nuklir, Energi, Otomotif, hingga Penerbangan bisa mengambil manfaat besar:

  • Evaluasi risiko desain baru tanpa menunggu kegagalan aktual.
  • Pengembangan sistem predictive maintenance berbasis fisika.
  • Desain sistem dengan daya tahan tinggi namun efisien biaya.

Untuk platform pembelajaran dan edukasi teknik, artikel ini bisa menjadi:

  • Modul lanjutan untuk mata kuliah Reliability Engineering.
  • Studi kasus simulasi interaktif (menggabungkan FEA, Bayesian, dan probabilistik).
  • Konten unggulan di bootcamp teknologi nuklir atau industri energi masa depan.

Kritik & Catatan Lanjutan

  • Perlu lebih banyak studi eksperimen untuk validasi parameter model wear-fatigue.
  • Model interaksi antar mekanisme kegagalan masih dalam tahap awal—ke depan harus diperluas ke lebih banyak kombinasi kegagalan.
  • Implementasi ke PRA aktual butuh kolaborasi erat antar disiplin: teknik mesin, statistik, hingga informatika.

Kesimpulan: Menuju PRA Generasi Baru yang Lebih Cerdas

Makalah ini bukan sekadar pengembangan metodologi, tapi pergeseran paradigma dalam mengelola risiko teknis. Dengan memasukkan mekanisme fisik kegagalan ke dalam model PRA, kita membuka peluang besar untuk:

  • Memahami kegagalan lebih dalam,
  • Mengantisipasi risiko lebih cepat,
  • dan mengoptimalkan sistem tanpa overdesign.

Pendekatan physics-based CCF ini menandai awal era baru “causality-driven reliability yang tidak lagi sekadar menunggu data kegagalan, tapi memprediksinya sebelum terjadi.

Referensi : Zahra Mohaghegh, Mohammad Modarres, Aris Christou. Physics-Based Common Cause Failure Modeling in Probabilistic Risk Analysis: A Mechanistic Perspective. Proceedings of the ASME 2011 Power Conference, POWER2011-55324.

Selengkapnya
Membangun Keandalan Sistem Lewat Fisika Kegagalan: Terobosan Baru dalam Analisis Risiko

Physics of Failure Modeling

Meninggalkan MTBF: Physics-of-Failure sebagai Pilar Baru Rekayasa Keandalan Elektronik

Dipublikasikan oleh Dewi Sulistiowati pada 11 April 2025


Pendahuluan: Kegagalan Prediksi Keandalan di Era Modern

Di tengah kemajuan teknologi dan miniaturisasi komponen elektronik, metode klasik seperti MIL-HDBK-217 semakin dipertanyakan efektivitasnya. Artikel karya Zoran Mati dan Vlado Sruk ini menyoroti perlunya perubahan paradigma menuju pendekatan Physics-of-Failure (PoF) sebagai alternatif berbasis mekanisme kegagalan nyata, bukan asumsi statistik belaka.

Mengapa Pendekatan Klasik Dianggap Usang?

Keterbatasan utama dari metode klasik:

  • Asumsi laju kegagalan konstan (constant failure rate).
  • Data tak terbarukan, tidak sesuai dengan teknologi baru.
  • Mengabaikan perbedaan vendor, proses produksi, dan lingkungan operasional.
  • Reliabilitas produk hanya diuji di akhir siklus pengembangan.

Contoh nyata: komponen plastik encapsulated (PEMs) yang ditolak untuk aplikasi militer meskipun data lapangan menunjukkan kegagalan jauh lebih rendah dari prediksi MIL-HDBK-217.

Physics-of-Failure: Apa Itu dan Mengapa Lebih Akurat?

PoF berangkat dari prinsip bahwa kegagalan komponen terjadi akibat akumulasi kerusakan yang melampaui ketahanan fisik material. Pendekatan ini mempertimbangkan:

  • Lingkungan operasi: suhu, getaran, kelembaban.
  • Desain dan material: struktur mikro, sambungan solder, lapisan pelindung.
  • Proses manufaktur: ketidaksesuaian material atau teknik produksi.

Dengan PoF, insinyur tidak hanya tahu kapan komponen gagal, tetapi juga mengapa dan bagaimana mencegahnya sejak awal desain.

Empat Langkah Utama Prosedur PoF

  1. Identifikasi Lingkungan Operasional:
    Data suhu, tekanan, kelembaban dikumpulkan dari profil misi nyata.
  2. Penentuan Triad Kegagalan (lokasi, mode, mekanisme):
    Contoh: solder joint retak akibat siklus termal → mode: retak → mekanisme: thermal fatigue.
  3. Analisis Faktor Kontributor Kegagalan:
    Misalnya, getaran resonan memperparah mikro retakan.
  4. Pemilihan Model Matematis:
    Gunakan model seperti Arrhenius untuk difusi, Coffin-Manson untuk fatigue, dan tetapkan batas validitas model.

Kelebihan Strategis Pendekatan PoF

1. Bandingkan Kandidat Desain Sejak Awal

  • Memungkinkan pemilihan desain yang lebih efisien dan hemat biaya.
  • Contoh: membandingkan dua jenis IC packaging dalam lingkungan ekstrem suhu tinggi.

2. Peringatan Dini terhadap Masalah Desain/Proses

  • Tidak perlu menunggu siklus “test-analyze-fix” (TAF) berkali-kali.
  • Mengurangi waktu pengembangan dan mempercepat ke pasar.

3. Prediksi Lebih Realistis

  • Menghindari desain berlebihan atau terlalu konservatif.
  • Menyesuaikan strategi pemeliharaan berdasarkan kondisi aktual.

4. Estimasi Umur untuk Berbagai Profil Misi

  • Contoh: komponen elektronik pada mobil vs pesawat memiliki pola degradasi berbeda.

5. Optimasi Burn-in / Environmental Stress Screening (ESS)

  • Hindari aging yang tidak perlu akibat pengujian berlebihan.

Probabilistic Physics-of-Failure (PPoF): Masa Depan PoF

PoF klasik bersifat deterministik. Namun, kenyataan menunjukkan banyak variabel acak seperti:

  • Fluktuasi lingkungan (misal: suhu tidak selalu stabil).
  • Variasi proses manufaktur (defek mikro, ketidakkonsistenan alat).
  • Profil misi dinamis.

Solusi: Integrasikan metode probabilistik (misalnya simulasi Monte Carlo, Bayesian inference) ke dalam model PoF untuk menghasilkan prediksi berbasis distribusi probabilitas, bukan nilai tetap.

Contoh penerapan awal: Haggag et al. menerapkan PP-o-F untuk transistor deep-submicron dan interkoneksi optik dengan hasil yang menjanjikan

Perbandingan Langsung: PoF vs Pendekatan Klasik

Perbandingan antara pendekatan klasik (MIL-HDBK-217) dan Physics-of-Failure (PoF) dalam analisis keandalan menunjukkan perbedaan yang signifikan. Pendekatan klasik didasarkan pada statistik historis, yang menghasilkan akurasi prediksi yang rendah dan cenderung rata-rata. Selain itu, fleksibilitas lingkungan dalam pendekatan ini terbatas, dan penerapannya biasanya dilakukan di akhir siklus pengembangan. Di sisi lain, PoF menggunakan model fisik kegagalan, yang memberikan akurasi prediksi yang tinggi berdasarkan kondisi nyata. Pendekatan ini juga menawarkan fleksibilitas yang tinggi terhadap berbagai lingkungan dan dapat diterapkan sejak awal desain. Selain itu, PoF sangat cocok untuk teknologi baru, sementara pendekatan klasik kurang kompatibel. Meskipun pendekatan probabilistik dalam PoF masih sedang berkembang, hal ini menunjukkan potensi untuk meningkatkan analisis keandalan di masa depan.

Contoh Nyata: Elektromigrasi dan Perancangan Thermal

Dalam studi oleh Mortin et al., perbandingan antara:

  • Hazard rate konstan (pendekatan klasik)
  • vs
  • Hazard rate yang meningkat (mengikuti model elektromigrasi aktual)

menunjukkan bahwa desain berdasarkan hazard rate konstan cenderung salah arah:

  • Terlalu mahal karena over-design
  • Atau justru under-design yang berujung kegagalan dini

Kritik terhadap Pendekatan Klasik: Suara Komunitas

  • Patrick D.T. O’Connor menyebut MIL-HDBK-217 sebagai “garbage” yang harus segera ditinggalkan.
  • Pecht (1996) mencatat kelemahan metode klasik:
    • Data usang
    • Tidak membedakan antara kegagalan desain dan manufaktur
    • Asumsi laju kegagalan konstan sangat keliru
    • Model tidak spesifik terhadap vendor atau perangkat

Arah Masa Depan: Kebutuhan Akan Metodologi Baru

Dengan meningkatnya daya komputasi dan akses simulasi numerik, pendekatan probabilistik berbasis PoF akan:

  • Mengisi celah antara teori dan kenyataan operasional
  • Meningkatkan akurasi prediksi reliabilitas
  • Mendukung desain multi-lingkungan secara global

Kesimpulan: Saatnya Berubah

Physics-of-Failure bukan sekadar teknik, melainkan paradigma baru. Dengan mendasari keandalan pada realitas fisik dan memanfaatkan pendekatan probabilistik, PoF memberikan jalan menuju desain sistem elektronik yang lebih tahan lama, hemat biaya, dan unggul secara kompetitif.

Meskipun pendekatan klasik memiliki nilai sebagai titik awal atau referensi historis, PoF dan PPoF akan menjadi tulang punggung rekayasa keandalan generasi berikutnya.

Sumber artikel : Zoran Mati, Vlado Sruk. The Physics-of-Failure Approach in Reliability Engineering, Proceedings of the ITI 2008 30th International Conference on Information Technology Interfaces, June 23–26, 2008, Cavtat, Croatia. IEEE. DOI: 10.1109/ITI.2008.4588504.

Selengkapnya
Meninggalkan MTBF: Physics-of-Failure sebagai Pilar Baru Rekayasa Keandalan Elektronik

Physics of Failure Modeling

Rahasia Keandalan IGBT: Strategi Micro-Sectioning & Four-Point Probing dalam Deteksi Dini Kerusakan Modul Daya

Dipublikasikan oleh Dewi Sulistiowati pada 11 April 2025


Pendahuluan: Masalah yang Sering Terjadi Tapi Jarang Terlihat

Dalam industri energi, otomotif, dan elektronik berdaya tinggi, modul IGBT (Insulated Gate Bipolar Transistor) menjadi jantung dari sistem konversi daya. Namun, kegagalan mendadak pada modul masih menjadi masalah besar, meskipun telah melalui pengujian daya tahan. Penyebab utamanya? Interkoneksi lemah, terutama di area bonding wire dan solder yang sering kali terabaikan dalam pemantauan real-time.

Kristian Bonderup Pedersen, dalam disertasinya di Aalborg University, menjawab tantangan ini dengan kombinasi pendekatan Physics-of-Failure (PoF) dan teknik karakterisasi mikro untuk menganalisis degradasi antarmuka pada modul IGBT. Artikel ini akan membedah teknik dan temuan utama, serta menyambungkannya dengan tren industri terkini dalam pemeliharaan prediktif.

Fokus Studi: Modul Daya Berbasis IGBT dan Titik Lemahnya

Modul IGBT umumnya terdiri dari:

  • Lapisan baseplate (3000 µm)
  • Solder & DCB (Direct Copper Bonded substrate)
  • Chip diode & IGBT (300 µm)
  • Interkoneksi aluminium wire (400 µm)

Masalah utama muncul pada antarmuka antara Aluminium bond wire dan chip/metal base, yang rentan terhadap:

  • Fatigue mekanik akibat mismatch ekspansi termal
  • Lift-off dari wire bond
  • Cracking di area "heel" wire
  • Delaminasi solder dan degradasi grain

Teknik Diagnostik: Micro-Sectioning dan Four-Point Probing

1. Micro-Sectioning: Autopsi Komponen Elektronik

Metode ini digunakan untuk membuka dan melihat struktur granular pada antarmuka wire secara detail melalui:

  • Polishing mekanik dan kimia
  • Electro-etching dengan Barker’s reagent
  • Mikroskopi cahaya terpolarisasi dan SEM (Scanning Electron Microscopy)

Hasilnya memungkinkan:

  • Visualisasi grain refinement region
  • Penilaian kualitas bonding berdasarkan struktur mikroskopik
  • Estimasi umur pakai berdasarkan area rekristalisasi

2. Four-Point Probing: Deteksi Non-Destruktif

Teknik ini memungkinkan pengukuran resistansi lokal antar komponen (chip, solder, wire) tanpa merusak.
Manfaatnya:

  • Identifikasi degradasi dini pada interkoneksi
  • Evaluasi kerataan arus listrik antar wire
  • Mendeteksi potensi delaminasi sebelum kegagalan total

Studi Kasus A: Efek Kualitas Bonding terhadap Ketahanan

Variasi Sample dan Parameter

  • 2 tipe kabel Al (A dan B), kemurnian 99,99%
  • 3 level daya bonding (1.0x, 1.25x, 1.5x)
  • Total 6 kombinasi: A1–A3 dan B1–B3
  • Diuji dengan shear test, microscopy, dan FIB cross-section

Temuan Kunci:

  • Semakin tinggi power ultrasonik, semakin besar refinement zone → bonding lebih kuat
  • Wire A (grain besar): shear test tinggi, refinement abrupt
  • Wire B (grain kecil): shear test kuat tapi lebih sulit dibonding sempurna
  • 3D reconstruction memperlihatkan bahwa grain halus terbentuk membentuk setengah elipsoid di bawah permukaan bonding

Studi Kasus B: Deteksi Degradasi dengan Four-Point Probing

Modul yang Diuji:

  • Module A (baru)
  • Module B (tengah siklus)
  • Module C (hampir rusak)

Konfigurasi Pengujian:

  1. Sectional probing: mengukur resistansi dari terminal IGBT → Output
  2. Chip-level probing: mengukur resistansi solder dan metalisasi
  3. Wire interface probing: resistansi lokal pada interface wire-chip

Hasil:

  • Module C menunjukkan kenaikan resistansi signifikan di beberapa wire
  • Perbedaan resistansi paling besar terdeteksi di wire ujung (lebih panjang)
  • Crack dan delaminasi bisa diidentifikasi sebelum benar-benar rusak

Relevansi untuk Industri dan Tren Ke Depan

Keunggulan Kombinasi Micro-Sectioning & Probing:

  • Diagnostik berbasis ilmu fisika, bukan asumsi statistik
  • Akurat bahkan untuk modul tanpa data historis
  • Bisa digunakan untuk optimasi desain wire bonding dan solder

Potensi Aplikasi:

  • Industri otomotif & energi: prediksi kerusakan inverter dan konverter
  • Platform e-learning teknik: simulasi bonding & degradasi
  • Desain sistem prediktif AI dalam digital twin

Kritik dan Saran

Tantangan:

  • Micro-sectioning destruktif, cocok hanya untuk sampling terbatas
  • Four-point probing butuh presisi tinggi → alat ukur mahal
  • Belum semua proses inline manufacturing bisa mengakomodasi pendekatan ini

Saran Pengembangan:

  • Kembangkan metode semi-destruktif atau berbasis X-ray diffraction
  • Integrasi probing ke dalam mesin uji otomatis di lini produksi
  • AI-assisted pattern recognition dari citra grain refinement

Kesimpulan: Diagnostik Modern untuk Modul Masa Depan

Pedersen menawarkan pendekatan terobosan dan aplikatif untuk memahami degradasi modul IGBT hingga ke tingkat mikroskopik. Teknik ini mengubah cara kita melihat keandalan bukan hanya sebagai hasil statistik, tapi sebagai fenomena fisis yang bisa diukur, divisualisasi, dan dicegah.

Bagi pelaku industry, teknik ini membuka peluang:

  • Memperpanjang umur produk
  • Mengurangi klaim garansi
  • Mempercepat validasi desain

Dan bagi platform edukasi atau engineer masa depan, ini adalah bekal teknis yang mengakar pada realita lapangan dan prinsip ilmiah yang kuat.

Referensi : Pedersen, Kristian Bonderup. IGBT Module Reliability. Physics-of-Failure Based Characterization and Modelling. PhD Thesis, Aalborg University, 2014.

Selengkapnya
Rahasia Keandalan IGBT: Strategi Micro-Sectioning & Four-Point Probing dalam Deteksi Dini Kerusakan Modul Daya

Physics of Failure Modeling

Mengukur Keandalan Produk Secara Cepat: Pendekatan Statistik Tak Pasti dalam Accelerated Life Testing

Dipublikasikan oleh Dewi Sulistiowati pada 11 April 2025


Pendahuluan: Tantangan Uji Keandalan di Era Produk Super Tangguh

Di era teknologi maju, perangkat elektronik dan mekanis semakin tangguh. Namun, justru karena daya tahannya yang tinggi, pengujian kebisingan (pengujian reliabilitas) sehingga memakan waktu dan biaya besar. Menunggu produk rusak secara alami bisa memakan waktu bertahun-tahun. Maka, muncullah metode Accelerated Life Testing (ALT) — solusi untuk mempercepat pengumpulan data masa pakai produk dengan "mempercepat kematian" produk lewat stres buatan seperti suhu tinggi atau tegangan ekstrim.

Makalah karya Abdullah Ali H. Ahmadini (Durham University, 2019) memperkenalkan pendekatan analisis baru dalam ALT: metode statistik berbasis bumi (metode statistik tidak tepat) yang menawarkan solusi lebih fleksibel dan realistis untuk kondisi data tidak lengkap dan model yang kompleks.

Apa Itu Metode Statistik yang Tidak Tepat?

Pendekatan statistik biasanya konvensional mengandalkan asumsi yang kuat tentang distribusi data. Misalnya, kita menganggap waktu gagal suatu produk mengikuti distribusi Weibull atau Eksponensial. Namun, kenyataannya tidak selalu konsisten. Oleh karena itu, pendekatan "probabilitas tidak tepat" hadir sebagai solusi — alih-alih satu nilai, probabilitas dinyatakan dalam jarak (interval) . Ini memungkinkan model lebih tahan terhadap pelanggaran informasi atau data yang kurang.

Accelerated Life Testing (ALT): Prinsip Dasar

ALT mempercepat kegagalan produk dengan memberikan beban lebih besar dari kondisi normal — seperti suhu tinggi, tegangan ekstrem, atau tekanan. Dengan itu, kita bisa memprediksi masa pakai dalam waktu singkat .

Tiga jenis model hubungan stres-waktu kegagalan:

  • Model Arrhenius : untuk stres suhu (berbasis teori kimia).
  • Model Eyring : alternatif Arrhenius dengan pendekatan lebarnya.
  • Model Power-Law : untuk tegangan tegangan.

Model ini menghubungkan parameter distribusi kegagalan (biasanya skala/skala) di berbagai tingkat stres.

Kontribusi Utama Penelitian Ini

1. Integrasi NPI dan Fungsi Link

Penelitian ini menggabungkan:

  • Nonparametric Predictive Inference (NPI) : memberikan prediksi dalam bentuk interval survival function , bukan satu nilai.
  • Fungsi Link : menghubungkan tingkat stres tinggi ke tingkat normal, agar data dari ALT dapat digunakan untuk meramalkan kegagalan pada kondisi riil.

2. Estimasi Ketidaktepatan Berdasarkan Uji Statistik

  • Penulis tidak sembarangan menentukan interval jarak (γ).
  • Digunakan uji rasio kemungkinan (LRT) dan uji log-rank antara data pada tingkat stres yang berbeda.
  • Jika data hasil transformasi dari stres tinggi ke stres normal tidak berbeda signifikan , maka dianggap cocok → interval γ ditentukan berdasarkan batas "tidak berbeda".

Studi Kasus: Data Simulasi & Garansi Produk

Contoh Simulasi

  • Data kegagalan disimulasikan dari distribusi Weibull.
  • 10 data per level stres : normal (K₀ = 283K), tinggi 1 (K₁ = 313K), tinggi 2 (K₂ = 353K).
  • Parameter Arrhenius γ = 5200 → menentukan skala α:
    • α₀ (normal) = 7000
    • α₁ = 1202,94
    • α₂ = 183,09

Dari simulasi ini, diuji apakah hasil transformasi data ALT (misalnya dari K₂ ke K₀) secara statistik sama dengan data asli di K₀. Jika ya, data ALT sah digunakan untuk prediksi masa pakai pada level normal.

Aplikasi pada Desain Garansi

Di bab 5, metode ini digunakan untuk menentukan:

  • Biaya penalti tetap (Kebijakan A)
  • Biaya penalti tergantung waktu (Kebijakan B)

Simulasi digunakan untuk memperkirakan rata-rata biaya garansi , sehingga membantu produsen menetapkan harga jual atau periode garansi optimal .

Kelebihan Pendekatan Ahmadini

  • Kuat : Tidak terlalu tergantung pada asumsi distribusi.
  • Fleksibel : Cocok saat data ALT terbatas atau tidak lengkap.
  • Praktis : Bisa digunakan untuk evaluasi garansi dan prediksi masa pakai.
  • Skalabel : Dapat dikembangkan menjadi model degradasi yang lebih kompleks atau pengujian lebih dari 2 tingkat stres.

Kritik & Peluang Pengembangan

Kritik:

  • Masih berdasarkan asumsi model link sederhana (Arrhenius atau Power-Law).
  • Belum mengakomodasi degradasi bertahap atau mode kegagalan ganda .
  • Validasi empiris masih terbatas pada simulasi dan satu kasus nyata.

Peluang:

  • Integrasi dengan pembelajaran mesin untuk prediksi lebih adaptif .
  • Pengembangan ke sensor data secara kontinu atau real-time .
  • Ekspansi ke industri non-elektronik (misalnya biomedis atau otomotif).

Relevansi Industri & Pendidikan

Untuk Industri :

  • Produsen elektronik, otomotif, dan alat berat bisa menggunakan metode ini untuk:
    • Menentukan periode garansi optimal
    • Menghindari over-engineering atau under-warranty

Untuk Platform Pendidikan :

  • Bisa dijadikan konten kursus statistik industri, kendali mutu, atau rekayasa keandalan.
  • Modul yang dapat dikembangkan:
    • “Pengantar ALT dan Probabilitas Tak Pasti”
    • “Desain Garansi Berbasis Data
    • Simulasi Analisis Kelangsungan Hidup untuk Industri”

Kesimpulan: Menuju Pengujian Keandalan yang Lebih Cerdas

Penelitian Ahmadini membuka jalan pendekatan statistik modern dalam ALT. Dengan menggabungkan Nonparametric Predictive Inference (NPI) dan uji hipotesis statistik , ia memberikan alternatif yang lebih fleksibel dan realistis dalam menangani data yang tidak pasti atau parsial.

Referensi : Ahmadini, Abdullah Ali H. Metode Statistik yang Tidak Tepat untuk Pengujian Kehidupan yang Dipercepat . Tesis PhD, Departemen Ilmu Matematika, Durham

 

Selengkapnya
Mengukur Keandalan Produk Secara Cepat: Pendekatan Statistik Tak Pasti dalam Accelerated Life Testing
« First Previous page 2 of 3 Next Last »