Teknik Industri

Memahami Pembelajaran Tanpa Pengawasan (Unsupervised Learning) dalam Jaringan Saraf Tiruan

Dipublikasikan oleh Muhammad Ilham Maulana pada 03 April 2024


Pembelajaran tanpa pengawasan (unsupervised learning) adalah sebuah metode dalam pembelajaran mesin di mana algoritma belajar pola-pola secara ekslusif dari data yang tidak berlabel. Tujuannya adalah melalui peniruan (mimicry), yang merupakan mode pembelajaran penting pada manusia, mesin dipaksa untuk membangun representasi yang ringkas tentang dunianya dan kemudian menghasilkan konten imajinatif darinya.

Metode lain dalam spektrum pengawasan adalah Pembelajaran Penguatan (Reinforcement Learning) di mana mesin hanya diberikan skor kinerja numerik sebagai panduan, dan Pembelajaran Lemah atau Semi-Pengawasan di mana sebagian kecil data diberi label, dan Pembelajaran Kendali Sendiri (Self-Supervision).

Tugas vs. Metode dalam Jaringan Saraf Tiruan 

Tugas jaringan saraf tiruan sering dikategorikan sebagai diskriminatif (pengenalan) atau generatif (imajinasi). Meskipun tidak selalu, tugas diskriminatif cenderung menggunakan metode pembelajaran terbimbing, sedangkan tugas generatif menggunakan pembelajaran tanpa pengawasan. Namun, pemisahan ini sangat kabur. Misalnya, pengenalan objek cenderung menggunakan pembelajaran terbimbing, tetapi pembelajaran tanpa pengawasan juga dapat mengelompokkan objek ke dalam kelompok. Selain itu, seiring kemajuan, beberapa tugas menggunakan kombinasi kedua metode, dan beberapa tugas beralih dari satu metode ke metode lainnya. Sebagai contoh, pengenalan gambar awalnya sangat bergantung pada pembelajaran terbimbing, tetapi kemudian menjadi hibrida dengan menggunakan pra-pelatihan tanpa pengawasan, dan akhirnya kembali ke metode terbimbing dengan munculnya dropout, ReLU, dan learning rate adaptif.

Proses Pelatihan 

Selama fase pembelajaran, jaringan tanpa pengawasan berusaha meniru data yang diberikan dan menggunakan kesalahan dalam hasil tiru-tiruan untuk memperbaiki diri sendiri (yaitu, memperbaiki bobot dan biasnya). Terkadang kesalahan diekspresikan sebagai probabilitas rendah bahwa output yang salah terjadi, atau mungkin diekspresikan sebagai keadaan energi tinggi yang tidak stabil dalam jaringan.

Berbeda dengan metode terbimbing yang mendominasi penggunaan backpropagation, pembelajaran tanpa pengawasan juga menggunakan metode lain termasuk: Aturan Pembelajaran Hopfield, Aturan Pembelajaran Boltzmann, Contrastive Divergence, Wake Sleep, Inferensi Variasional, Maximum Likelihood, Maximum A Posteriori, Gibbs Sampling, dan backpropagating reconstruction errors atau hidden state reparameterizations.

Energ 

Sebuah fungsi energi adalah ukuran makroskopik dari keadaan aktivasi jaringan. Dalam mesin Boltzmann, fungsi ini memainkan peran sebagai Fungsi Biaya. Analogi dengan fisika ini terinspirasi oleh analisis Ludwig Boltzmann tentang energi makroskopik gas dari probabilitas mikroskopik gerakan partikel {\displaystyle p\propto e^{-E/kT}}, di mana k adalah konstanta Boltzmann dan T adalah suhu. Dalam jaringan RBM, relasinya adalah {\displaystyle p=e^{-E}/Z}, di mana {\displaystyle p} dan {\displaystyle E} bervariasi di setiap pola aktivasi yang mungkin dan {\displaystyle \textstyle {Z=\sum _{\scriptscriptstyle {\text{All Patterns}}}e^{-E({\text{pattern}})}}}. Untuk lebih jelas, {\displaystyle p(a)=e^{-E(a)}/Z}, di mana {\displaystyle a} adalah pola aktivasi semua neuron (terlihat dan tersembunyi). Oleh karena itu, beberapa jaringan saraf awal dinamakan Mesin Boltzmann. Paul Smolensky menyebut {\displaystyle -E\,} sebagai Harmoni. Sebuah jaringan mencari energi rendah yang berarti Harmoni tinggi.

Jenis-Jenis Jaringan 

Artikel ini menyajikan diagram koneksi berbagai jaringan tanpa pengawasan, di mana detail akan diberikan dalam bagian Perbandingan Jaringan. Lingkaran mewakili neuron dan tepi di antaranya adalah bobot koneksi. Seiring perubahan desain jaringan, fitur ditambahkan untuk memungkinkan kemampuan baru atau dihilangkan untuk mempercepat pembelajaran. Misalnya, neuron berubah antara deterministik (Hopfield) dan stokastik (Boltzmann) untuk memungkinkan output yang kuat, bobot dihilangkan dalam satu lapisan (RBM) untuk mempercepat pembelajaran, atau koneksi diizinkan menjadi asimetris (Helmholtz).

Contoh gambar.

Dalam dunia pembelajaran mesin, pembelajaran tanpa pengawasan (unsupervised learning) memegang peran penting dalam mengekstraksi pola dan struktur tersembunyi dari data tanpa label. Artikel ini akan mengeksplorasi beberapa metode dan jaringan yang digunakan dalam pembelajaran tanpa pengawasan, serta memberikan gambaran tentang perkembangan historisnya.

Sejarah Singkat:

  • 1969: Perceptrons oleh Minsky & Papert menunjukkan bahwa perceptron tanpa lapisan tersembunyi gagal pada masalah XOR.
  • 1974: Model magnetik Ising diusulkan oleh WA Little untuk kognisi.
  • 1980: Fukushima memperkenalkan neocognitron, yang kemudian disebut jaringan konvolusi, banyak digunakan dalam pembelajaran terbimbing.
  • 1982: Varian Ising, Jaringan Hopfield, dijelaskan sebagai CAM (Content Addressable Memory) dan pengklasifikasi oleh John Hopfield.
  • 1983: Varian Ising lain, Mesin Boltzmann dengan neuron probabilistik, diperkenalkan oleh Hinton & Sejnowski.
  • 1986: Paul Smolensky menerbitkan Teori Harmoni, yang merupakan RBM dengan fungsi energi Boltzmann yang praktis sama.
  • 1995: Schmidthuber memperkenalkan neuron LSTM untuk bahasa.
  • 1995: Dayan & Hinton memperkenalkan Mesin Helmholtz.
  • 2013: Kingma, Rezende, & co. memperkenalkan Variational Autoencoder sebagai jaringan probabilitas grafis Bayesian dengan neural network sebagai komponen.

Jenis-Jenis Jaringan:

  1. Jaringan Hopfield: Terinspirasi dari feromagnetisme, neuron menyerupai domain besi dengan momen magnetik biner. Koneksi simetris memungkinkan formulasi energi global.
  2. Mesin Boltzmann: Varian stokastik dari Jaringan Hopfield, di mana nilai state diambil dari pdf Bernoulli.
  3. Sigmoid Belief Net: Menerapkan ide dari model grafis probabilistik ke neural network. Jaringannya adalah grafik asiklik berarah yang jarang terhubung dengan neuron stokastik biner.
  4. Deep Belief Network: Hibrida dari RBM dan Sigmoid Belief Network, dengan dua lapisan teratas adalah RBM dan lapisan bawah membentuk sigmoid belief network.
  5. Mesin Helmholtz: Kombinasi dua jaringan dalam satu - bobot maju untuk pengenalan dan bobot mundur untuk imajinasi. Inspirasi awal untuk Variational Auto Encoders.
  6. Variational Autoencoder: Terinspirasi oleh Mesin Helmholtz, menggabungkan jaringan probabilitas dengan neural network. Encoder sebagai distribusi probabilitas dan decoder sebagai jaringan neural.

Metode Lainnya:

  • Pembelajaran Hebbian: Prinsip bahwa neuron yang memicu bersama akan terhubung, mendasari fungsi kognitif seperti pengenalan pola dan pembelajaran pengalaman.
  • Self-Organizing Map (SOM) dan Adaptive Resonance Theory (ART) adalah model neural network yang umum digunakan dalam algoritma pembelajaran tanpa pengawasan.
  • Metode probabilistik seperti analisis komponen utama dan kluster digunakan dalam pembelajaran tanpa pengawasan untuk menemukan kesamaan dan kelompok dalam data.
  • Metode momen digunakan untuk mempelajari parameter model variabel laten, seperti dalam pemodelan topik.

Dengan eksplorasi terus-menerus dalam metode pembelajaran tanpa pengawasan, kita dapat meningkatkan kemampuan kecerdasan buatan dalam mengekstraksi wawasan berharga dari data kompleks tanpa label, membuka pintu untuk penemuan dan inovasi baru di berbagai bidang.


Disadur dari: id.wikipedia.org

Selengkapnya
Memahami Pembelajaran Tanpa Pengawasan (Unsupervised Learning) dalam Jaringan Saraf Tiruan

Teknik Industri

Mengenal Pembelajaran Terpandu (Supervised Learning)

Dipublikasikan oleh Muhammad Ilham Maulana pada 02 April 2024


Pembelajaran terpandu (supervised learning) merupakan salah satu paradigma dalam machine learning di mana data masukan (seperti vektor fitur) dan nilai keluaran yang diinginkan (sinyal pengawasan berlabel manusia) digunakan untuk melatih sebuah model. Data pelatihan diproses untuk membangun sebuah fungsi yang memetakan data baru ke nilai keluaran yang diharapkan. Skenario optimal akan memungkinkan algoritma untuk menentukan nilai keluaran dengan benar untuk instance yang belum pernah dilihat sebelumnya.

Langkah-langkah dalam Pembelajaran Terpandu:

  1. Menentukan jenis contoh pelatihan (seperti karakter tulisan tangan, kata, atau kalimat).
  2. Mengumpulkan data pelatihan yang representatif dari penggunaan dunia nyata.
  3. Menentukan representasi fitur masukan dari fungsi yang akan dipelajari.
  4. Menentukan struktur fungsi yang dipelajari dan algoritma pembelajaran terkait (seperti Support Vector Machines, Regresi Logistik, atau Pohon Keputusan).
  5. Menjalankan algoritma pembelajaran pada data pelatihan dan menyesuaikan parameter kontrol.
  6. Mengevaluasi akurasi fungsi yang dipelajari pada data uji yang terpisah dari data pelatihan.

Dalam memilih algoritma pembelajaran terpandu, ada beberapa faktor penting yang perlu dipertimbangkan, seperti trade-off bias-varians, kompleksitas fungsi, dimensi ruang masukan, dan kebisingan dalam nilai keluaran. Trade-off bias-varians mengacu pada keseimbangan antara kemampuan model untuk mempelajari pola dengan baik (bias rendah) dan kemampuannya untuk mengeneralisasi pola tersebut pada data baru (varians rendah). Kompleksitas fungsi mengacu pada seberapa rumit fungsi yang dipelajari, semakin kompleks semakin banyak data yang dibutuhkan untuk melatihnya dengan baik. Dimensi ruang masukan mengacu pada jumlah fitur yang digunakan, semakin banyak fitur semakin sulit untuk mempelajari pola yang relevan. Kebisingan dalam nilai keluaran mengacu pada adanya kesalahan atau noise dalam data pelatihan, yang dapat menyebabkan overfitting jika tidak ditangani dengan baik.

Algoritma yang populer digunakan antara lain Support Vector Machines, Regresi Linear, Regresi Logistik, Naive Bayes, Linear Discriminant Analysis, Pohon Keputusan, K-Nearest Neighbor, Jaringan Syaraf Tiruan (Multilayer Perceptron), dan Similarity Learning. Masing-masing algoritma memiliki kelebihan dan kekurangan tersendiri, sehingga pemilihan algoritma yang tepat sangat bergantung pada karakteristik masalah dan data yang dimiliki.

Secara umum, algoritma pembelajaran terpandu bekerja dengan mencari fungsi yang meminimalkan risiko empiris (kesalahan pada data pelatihan) atau meminimalkan risiko struktural (yang juga memperhitungkan kompleksitas fungsi). Risiko empiris mengacu pada seberapa baik model dapat mempelajari pola dari data pelatihan, sedangkan risiko struktural juga memperhitungkan kemampuan model untuk mengeneralisasi pola tersebut pada data baru.

Selain itu, ada beberapa generalisasi dari masalah pembelajaran terpandu standar, seperti semi-supervised learning, active learning, structured prediction, dan learning to rank. Semi-supervised learning melibatkan penggunaan data yang sebagian berlabel dan sebagian tidak berlabel untuk melatih model. Active learning melibatkan proses interaktif di mana algoritma dapat meminta label untuk data tertentu selama proses pelatihan. Structured prediction digunakan ketika nilai keluaran yang diinginkan adalah objek kompleks seperti pohon parsing atau grafik berlabel. Learning to rank digunakan ketika masukan berupa kumpulan objek dan nilai keluaran yang diinginkan adalah peringkat dari objek-objek tersebut.

Dengan kemampuannya dalam mempelajari pola dari data berlabel, pembelajaran terpandu menjadi salah satu pendekatan penting dalam machine learning untuk membangun model yang dapat melakukan prediksi atau pengambilan keputusan berdasarkan data baru yang belum pernah dilihat sebelumnya. Aplikasinya sangat luas, mulai dari pengenalan pola, pengolahan bahasa alami, analisis sentimen, rekomendasi sistem, dan banyak lagi. Dengan memahami konsep dasar dan memilih algoritma yang tepat, pembelajaran terpandu dapat menjadi alat yang sangat kuat untuk mengekstrak pengetahuan dari data dan membantu pengambilan keputusan yang lebih baik.
 

Disadur dari: id.wikipedia.org/en.wikipedia.org/wiki/Supervised_learning

Selengkapnya
Mengenal Pembelajaran Terpandu (Supervised Learning)

Teknik Industri

Jaringan Ad Hoc Nirkabel: Memberdayakan Konektivitas Terdesentralisasi

Dipublikasikan oleh Muhammad Ilham Maulana pada 02 April 2024


Jaringan ad hoc nirkabel, juga dikenal sebagai WANET atau MANET, mewakili pendekatan terdesentralisasi untuk komunikasi nirkabel, berbeda dari pengaturan infrastruktur tradisional. Tidak seperti jaringan yang bergantung pada router tetap atau titik akses, jaringan ad hoc dibentuk secara spontan oleh perangkat yang berpartisipasi itu sendiri. Setiap node dalam jaringan berperan dalam merutekan data untuk node lain, secara dinamis menentukan penerusan data berdasarkan konektivitas jaringan dan algoritma perutean yang digunakan.

Ciri khas dari jaringan semacam ini terletak pada kesederhanaan pengaturan dan administrasinya, yang memungkinkan perangkat untuk membuat koneksi dan bergabung dengan jaringan di mana saja. Dalam MANET, setiap perangkat bebas bergerak secara independen ke segala arah, sehingga sering terjadi perubahan pada sambungan jaringan. Akibatnya, setiap perangkat berfungsi sebagai router, meneruskan lalu lintas yang bahkan tidak terkait dengan penggunaannya sendiri.

Tantangan utama dalam MANET adalah memastikan bahwa setiap perangkat terus menjaga informasi yang diperlukan untuk perutean lalu lintas yang efektif. Seiring dengan meningkatnya skala jaringan, mempertahankan status perutean secara real-time menjadi semakin kompleks karena faktor-faktor seperti lalu lintas overhead, goodput node individu, dan bandwidth komunikasi yang terbatas.

Jaringan ini dapat beroperasi secara mandiri atau terhubung ke Internet yang lebih luas, sering kali menampilkan beberapa transceiver antar node, sehingga menghasilkan topologi yang dinamis dan otonom. Biasanya, MANET memiliki lingkungan jaringan yang dapat dirutekan yang dilapisi di atas jaringan lapisan tautan ad hoc.

Sejarah Singkat

Secara historis, konsep jaringan ad hoc nirkabel sudah ada sejak awal tahun 1970-an dengan proyek PRNET yang disponsori oleh DARPA. Namun, baru pada pertengahan tahun 1990-an dengan munculnya kartu radio 802.11 yang murah, upaya akademis dan penelitian yang signifikan dimulai. Karya perintis oleh Charles Perkins dan Chai Keong Toh di awal tahun 1990-an meletakkan dasar untuk protokol routing seperti DSDV dan ABR, yang pada akhirnya mengarah pada implementasi praktis jaringan seluler ad hoc.

Sejak saat itu, jaringan ad hoc nirkabel tetap menjadi area penelitian yang dinamis, terus berkembang untuk mengatasi tantangan mobilitas, skalabilitas, dan perutean yang efisien. Dengan kemajuan teknologi dan protokol yang terus berlanjut, jaringan ini menjanjikan untuk beragam aplikasi mulai dari operasi militer hingga konektivitas sipil di lingkungan yang terpencil atau yang berubah dengan cepat.

Aplikasi Jaringan Nirkabel Ad Hoc

Jaringan nirkabel ad hoc adalah jaringan desentralisasi yang tidak bergantung pada infrastruktur tetap seperti menara radio atau titik akses. Jaringan ini terbentuk secara dinamis ketika perangkat seperti ponsel pintar, tablet, atau kendaraan saling terhubung secara langsung tanpa perantara. Sifat ad hoc yang fleksibel dan mudah didirikan membuatnya cocok untuk berbagai aplikasi, antara lain:

  1. Jaringan Kendaraan (VANETs) Kendaraan dapat berkomunikasi satu sama lain secara langsung menggunakan gelombang radio, membentuk jaringan sementara untuk berbagi informasi lalu lintas, mencegah kecelakaan, dan meningkatkan kecerdasan berkendara.
  2. Jaringan Militer Taktis Pasukan militer memanfaatkan jaringan ad hoc untuk komunikasi lapangan yang cepat, aman, dan tanpa bergantung pada infrastruktur tetap yang rawan diserang. Jaringan ini memungkinkan penyebaran cepat, mobilitas tinggi, dan ketahanan terhadap gangguan.
  3. Jaringan Pesawat Tanpa Awak (FANETs) Pesawat tanpa awak dapat berkomunikasi satu sama lain membentuk jaringan ad hoc di udara. Ini memungkinkan mereka berkoordinasi, berbagi data, dan melakukan misi pengintaian atau pengiriman barang secara efisien.
  4. Jaringan Kapal Kapal-kapal angkatan laut dapat membentuk jaringan ad hoc sementara di laut untuk komunikasi cepat antar kapal dan berbagi data multimedia dengan kecepatan tinggi.
  5. Jaringan Sensor Sensor nirkabel seperti pendeteksi suhu, kelembapan, atau kebisingan dapat membentuk jaringan ad hoc untuk mengumpulkan data secara luas dan real-time tanpa infrastruktur tetap.
  6. Jaringan Robot Robot dapat berkoordinasi membentuk jaringan ad hoc untuk berbagi informasi lokal dan memutuskan cara terbaik melaksanakan tugas secara kolaboratif.
  7. Tanggap Bencana Saat bencana merusak infrastruktur komunikasi, jaringan ad hoc memungkinkan petugas mengirim informasi dan berkoordinasi untuk upaya tanggap darurat dan penyelamatan.
  8. Jaringan Rumah Sakit Perangkat medis seperti sensor pasien, kamera video, dan instrumen dapat saling terhubung melalui jaringan ad hoc untuk memantau pasien, mengumpulkan data, dan menyampaikan peringatan dengan cepat.

Dengan mobilitas tinggi, penyebaran cepat, dan skalabilitas yang baik, jaringan ad hoc menawarkan solusi komunikasi fleksibel untuk berbagai kebutuhan di lapangan tanpa bergantung pada infrastruktur tetap.

Tantangan dalam Jaringan Ad Hoc Nirkabel: Menavigasi Kompleksitas untuk Konektivitas yang Lancar

Jaringan ad hoc nirkabel, yang dikenal karena sifatnya yang terdesentralisasi dan bergerak, menawarkan sejumlah keuntungan di berbagai aplikasi seperti bantuan bencana, komunikasi militer, dan pemantauan lingkungan. Namun, di tengah manfaat yang menjanjikan tersebut, jaringan-jaringan ini menghadapi tantangan teknis dan implementasi yang signifikan, bersamaan dengan efek samping potensial seperti polusi spektrum radio.

Keuntungan bagi Pengguna:

  • Sifat terdesentralisasi dan mobilitas memungkinkan aplikasi yang serbaguna di berbagai sektor.
  • Ketahanan ditingkatkan karena perantaraan multi-hop informasi, mengurangi risiko titik-titik kegagalan tunggal.
  • Fleksibilitas, skalabilitas, dan biaya administrasi yang lebih rendah berkontribusi pada daya tarik jaringan ad hoc dibandingkan dengan jaringan topologi tetap.

Kesulitan Implementasi:

  • Variasi kinerja jaringan karena tidak adanya arsitektur tetap dan topologi dinamis.
  • Dampak mobilitas perangkat pada kinerja jaringan, menyebabkan peningkatan pengiriman ulang data dan tantangan alokasi sumber daya.
  • Memodelkan mobilitas manusia secara akurat tetap menjadi tantangan berkelanjutan karena berbagai faktor yang memengaruhinya.

Efek Samping:

  • Penggunaan spektrum frekuensi tanpa lisensi berkontribusi pada polusi spektrum radio.

Radio dan Modulasi:

  • Pemilihan frekuensi radio dan modulasi melibatkan kompromi, mempertimbangkan faktor seperti lebar pita, konsumsi daya, dan mobilitas.
  • Berbagai jenis radio dan teknik modulasi digunakan, masing-masing dengan keuntungan dan keterbatasan tersendiri.
  • Teknologi Wi-Fi generasi berikutnya seperti 802.11ax dan WiGi menawarkan kapasitas dan throughput yang lebih baik untuk jaringan ad hoc berkinerja tinggi.

Tumpukan Protokol:

  • Tantangan meluas di berbagai lapisan tumpukan protokol OSI, termasuk akses media, routing, dan lapisan transport.
  • Mobilitas tinggi node-node membuat sulit menjaga koneksi yang stabil dan routing yang efisien.
  • Desain lintas-lapisan memfasilitasi pengambilan keputusan optimal dan pertukaran informasi antara lapisan fisik dan lapisan atas.

Routing:

  • Protokol routing dalam jaringan ad hoc terbagi menjadi kategori proaktif, reaktif, dan hibrida, masing-masing dengan kelebihan dan kekurangannya sendiri.
  • Tantangannya termasuk keterlambatan dalam penemuan rute, banjir jaringan, dan perlunya penanganan yang efisien terhadap koneksi yang putus.

Persyaratan Teknis untuk Implementasi:

  • Ketahanan jaringan bergantung pada sumber daya node, sifat perilaku, dan karakteristik link.
  • Restrukturisasi dinamis link membutuhkan solusi yang tepat waktu, efisien, dan scalable untuk memastikan konektivitas yang berkelanjutan.

Secara ringkas, meskipun jaringan ad hoc nirkabel menawarkan potensi besar untuk berbagai aplikasi, menangani tantangan yang terkait adalah kunci untuk mewujudkan manfaatnya secara penuh. Dengan penelitian dan inovasi yang terus berlangsung, mengatasi hambatan-hambatan ini akan membuka jalan bagi solusi jaringan ad hoc yang lebih tangguh, efisien, dan dapat diskalakan di masa depan.

Kontrol Akses Media

Dalam kebanyakan jaringan ad hoc nirkabel, node-node bersaing untuk mengakses medium nirkabel bersama, yang sering kali menghasilkan tabrakan (interference). Tabrakan dapat ditangani menggunakan penjadwalan terpusat atau protokol akses kontenisi terdistribusi. Dengan menggunakan komunikasi nirkabel yang kooperatif, kekebalan terhadap interferensi ditingkatkan dengan cara node tujuan menggabungkan interferensi diri dan interferensi dari node lain untuk meningkatkan proses dekoding sinyal yang diinginkan.

Simulasi

  • Pemodelan dan simulasi (M&S) penting untuk meramalkan berbagai situasi dalam jaringan ad hoc.
  • Alat simulasi seperti OPNET, NetSim, atau ns2 digunakan untuk melakukan pengujian parameter dan analisis what-if.
  • Faktor-faktor seperti topologi jalan, multi-path fading, kecepatan kendaraan, dan perilaku pengemudi harus dipertimbangkan dalam simulasi.

Uji Coba Emulasi:

  • Pada tahun 2009, ARL dan NRL mengembangkan testbed emulasi Jaringan Ad-Hoc Bergerak untuk menguji algoritma dan aplikasi.
  • Testbed ini menggunakan perangkat lunak "MANE" (Mobile Ad hoc Network Emulator) yang dikembangkan oleh NRL.

Model Matematika:

  • Model tradisionalnya adalah graf geometrik acak, digunakan untuk mensimulasikan jaringan mobile ad hoc.
  • Node-node tersebar secara acak dalam ruang fisik, dengan setiap node memiliki jangkauan radio tetap.
  • Node-node dipindahkan berdasarkan model acak, menghasilkan panjang rute dan jumlah multi-hop yang berbeda.

Keamanan Jaringan Ad Hoc Nirkabel

Sebagian besar jaringan ad hoc nirkabel rentan terhadap serangan karena kurangnya kontrol akses, yang dapat menyebabkan penggunaan sumber daya yang berlebihan atau penundaan paket yang tidak diinginkan. Untuk melindungi jaringan, diperlukan mekanisme otentikasi yang memastikan hanya node yang diotorisasi yang dapat mengakses jaringan. Namun, jaringan tetap rentan terhadap serangan pelepasan atau penundaan paket.

Dalam lingkungan yang berubah-ubah, mengamankan 'sesi' dengan setiap node secara individual tidaklah praktis. Sebagai gantinya, penggunaan kunci prabagian untuk enkripsi di lapisan link menjadi solusi umum.

Manajemen kepercayaan dalam jaringan ad hoc menghadapi tantangan karena keterbatasan sumber daya dan kompleksitas interaksi jaringan. Pendekatan yang diperlukan adalah pengembangan metrik kepercayaan komposit yang memperhitungkan berbagai aspek jaringan dan skema manajemen kepercayaan yang sesuai. Meskipun penting, pemantauan terus-menerus setiap node dalam jaringan merupakan tugas yang sulit karena ketidakkontinuan jaringan dan keterbatasan sumber daya.


Disadur dari: en.wikipedia.org/wiki/Wireless_ad_hoc_network

 

Selengkapnya
Jaringan Ad Hoc Nirkabel: Memberdayakan Konektivitas Terdesentralisasi

Teknik Industri

Mengulas Mendalam: Jaringan Sensor Nirkabel (WSNs) - Teknologi Canggih untuk Pemantauan Lingkungan dan Industri

Dipublikasikan oleh Muhammad Ilham Maulana pada 02 April 2024


Jaringan Sensor Nirkabel (Wireless Sensor Networks/WSN) telah muncul sebagai teknologi revolusioner, yang terdiri dari jaringan sensor khusus yang ditempatkan secara strategis untuk memantau berbagai parameter lingkungan. Sensor-sensor ini, yang tersebar di seluruh ruang, memainkan peran penting dalam mengumpulkan dan mengirimkan data tentang kondisi fisik ke pusat pusat. Dengan kemampuan untuk mengukur faktor-faktor seperti suhu, suara, tingkat polusi, kelembapan, dan angin, WSN menawarkan wawasan yang tak tertandingi tentang lingkungan kita.

Sama seperti jaringan ad hoc nirkabel, WSN mengandalkan konektivitas nirkabel untuk komunikasi tanpa batas dan pembentukan jaringan secara spontan. Hal ini memungkinkan data sensor ditransmisikan secara nirkabel, sehingga memudahkan pemantauan dan analisis secara real-time. Yang membedakan WSN adalah fungsionalitas dua arahnya - tidak hanya mengumpulkan data, tetapi juga memungkinkan kontrol atas aktivitas sensor, sehingga meningkatkan kegunaannya di berbagai aplikasi.

Awalnya dimotivasi oleh kebutuhan militer, terutama dalam pengawasan medan perang, WSN telah diadopsi secara luas di sektor industri dan konsumen. Industri memanfaatkan jaringan ini untuk tugas-tugas seperti pemantauan proses, pelacakan kesehatan mesin, dan bahkan manajemen pertanian. Keserbagunaan WSN menjadikannya alat yang sangat diperlukan dalam operasi modern.

Inti dari WSN adalah node-nya, mulai dari hanya beberapa hingga ribuan. Setiap node dilengkapi dengan komponen-komponen penting, termasuk transceiver radio, mikrokontroler, antarmuka sensor, dan sumber daya, biasanya berupa baterai atau sistem pemanenan energi. Meskipun ukurannya kecil, node sensor memiliki fungsionalitas yang luar biasa. Dari ukuran kotak sepatu hingga sekecil butiran debu, node ini hadir dalam berbagai bentuk, untuk memenuhi kebutuhan dan kendala tertentu.

Batasan sumber daya seperti energi, memori, kecepatan komputasi, dan bandwidth komunikasi menentukan desain dan kemampuan node sensor. Topologi WSN dapat sangat bervariasi, dari jaringan bintang sederhana hingga jaringan mesh nirkabel multi-hop yang rumit. Teknik propagasi seperti routing atau flooding semakin meningkatkan efisiensi transmisi data.

Dalam bidang ilmu komputer dan telekomunikasi, WSN mewakili area penelitian yang dinamis, dengan berbagai lokakarya dan konferensi yang didedikasikan untuk memajukan bidang ini. Acara seperti Lokakarya Internasional tentang Sensor Jaringan Tertanam (EmNetS), IPSN, SenSys, MobiCom, dan EWSN berfungsi sebagai platform untuk inovasi dan kolaborasi.

Penyebaran WSN secara luas menggarisbawahi signifikansi mereka, dengan sekitar 120 juta unit jarak jauh yang beroperasi secara global pada tahun 2010. Seiring dengan perkembangan teknologi, kemampuan dan aplikasi WSN diharapkan untuk berkembang lebih jauh, mengantarkan era baru keterhubungan dan pengambilan keputusan berbasis data.

Aplikasi WSN: Pemantauan Area, Kesehatan, dan Lingkungan

  • Pemantauan area merupakan aplikasi umum dari jaringan sensor nirkabel (WSN), yang digunakan untuk mendeteksi intrusi musuh atau membatasi wilayah pipa gas atau minyak.
  • Pemantauan kesehatan melibatkan berbagai jenis jaringan sensor untuk aplikasi medis, seperti perangkat terpasang di dalam tubuh, perangkat yang dikenakan, dan sistem tertanam di lingkungan sekitar.
  • Pemantauan habitat menggunakan WSN untuk memantau spesies dan habitat, mulai dari pulau hingga hutan.
  • Pemantauan lingkungan meliputi pemantauan kualitas udara, deteksi kebakaran hutan, deteksi longsor, dan pemantauan kualitas air di berbagai lokasi.
  • Pencegahan bencana alam menggunakan WSN untuk memantau perubahan kondisi lingkungan seperti banjir.
  • Pemantauan industri mencakup pemantauan kondisi mesin, pengumpulan data, pemantauan kualitas air, dan pemantauan struktur bangunan.
  • Penggunaan WSN juga luas dalam pengawasan terhadap ancaman seperti deteksi perangkat nuklir bawah tanah.
  • Pemantauan kejadian menggunakan sensor untuk mendeteksi kejadian seperti kecelakaan atau kebakaran dengan cepat.
  • WSN juga dapat diterapkan secara efisien dalam rantai pasokan untuk berbagai industri menggunakan elektronik low-power.

Ini adalah aplikasi penting dari WSN yang membuktikan kegunaan dan potensi teknologi ini dalam berbagai bidang.

Karakteristik Utama Jaringan Sensor Nirkabel (WSN) 

Jaringan Sensor Nirkabel (WSN) merupakan teknologi yang menarik perhatian di berbagai bidang, dari pemantauan lingkungan hingga pengelolaan industri. Artikel ini akan membahas karakteristik utama dari WSN yang menjadikannya solusi yang penting dalam dunia teknologi modern.

  1. Konsumsi Daya yang Terbatas: Salah satu tantangan utama dalam WSN adalah konsumsi daya yang terbatas, baik dari baterai maupun teknologi penghasil energi. Ini mengharuskan pengembang untuk memperhatikan efisiensi energi dalam desain dan implementasi sensor.

  2. Kemampuan Menangani Kegagalan Node: Kehandalan sistem adalah hal krusial dalam WSN. Sistem harus mampu menangani kegagalan node dengan baik agar tidak mengganggu operasi keseluruhan jaringan.

  3. Mobilitas Node: Beberapa aplikasi WSN membutuhkan mobilitas node, yang memungkinkan sensor untuk bergerak dalam lingkungan tertentu. Hal ini penting terutama dalam penggunaan jaringan sensor nirkabel di lingkungan yang dinamis.

  4. Heterogenitas dan Homogenitas Node: WSN dapat terdiri dari node-node dengan spesifikasi yang berbeda-beda (heterogenitas), atau node dengan spesifikasi serupa (homogenitas), tergantung pada kebutuhan aplikasi.

  5. Skalabilitas: WSN harus mampu mengatasi skala implementasi yang besar tanpa mengorbankan kinerja atau efisiensi sistem. Kemampuan untuk melakukan implementasi yang besar adalah salah satu kekuatan utama dari WSN.

  6. Ketahanan terhadap Kondisi Lingkungan yang Ekstrim: WSN sering kali digunakan dalam lingkungan yang keras dan berbeda-beda. Oleh karena itu, sensor harus mampu bertahan dan beroperasi di berbagai kondisi lingkungan yang ekstrem.

  7. Kemudahan Penggunaan: Desain dan implementasi WSN harus memperhatikan faktor kemudahan penggunaan, sehingga pengguna dapat dengan mudah mengelola dan memanfaatkan jaringan sensor nirkabel.

  8. Optimasi Lintas Lapisan: Dalam pengembangan WSN, optimasi lintas lapisan menjadi hal penting untuk meningkatkan kinerja dan efisiensi jaringan secara keseluruhan.

Dengan karakteristik-karakteristik ini, WSN telah membuktikan dirinya sebagai solusi yang kuat dan canggih dalam berbagai aplikasi, mulai dari pemantauan lingkungan hingga pengelolaan infrastruktur industri. Dengan terus berkembangnya teknologi, diharapkan WSN dapat terus memberikan kontribusi yang signifikan dalam memajukan dunia teknologi informasi.

Platform untuk Jaringan Sensor Nirkabel (WSN) 

Dalam dunia teknologi yang terus berkembang, jaringan sensor nirkabel (WSN) menjadi semakin penting untuk berbagai aplikasi, mulai dari pemantauan lingkungan hingga pengelolaan industri. Artikel ini akan menjelaskan platform yang mendukung teknologi WSN dan bagaimana karakteristik-karakteristiknya memengaruhi pengembangan dan implementasi WSN.

1. Perangkat Keras (Hardware) Salah satu tantangan utama dalam pengembangan WSN adalah produksi sensor node yang murah dan kecil. Ada banyak perusahaan kecil yang memproduksi perangkat keras WSN, menciptakan situasi komersial yang mirip dengan komputasi rumahan pada tahun 1970-an. Penggunaan metode komunikasi radio dan akuisisi data yang sangat hemat daya adalah hal yang penting dalam pengembangan perangkat keras WSN.

2. Jaringan Nirkabel (Wireless) Ada beberapa standar dan solusi nirkabel untuk konektivitas sensor node. Thread dan Zigbee dapat menghubungkan sensor pada frekuensi 2,4 GHz dengan data rate 250kbit/s. Selain itu, ada juga solusi yang menggunakan frekuensi yang lebih rendah untuk meningkatkan jangkauan radio. Contohnya adalah Z-wave yang beroperasi pada 915 MHz dan 868 MHz di Uni Eropa. Standar IEEE 802.15.4 menyediakan standar untuk konektivitas perangkat berdaya rendah, yang umumnya digunakan dalam sensor dan smart meter.

3. Perangkat Lunak (Software) Energi merupakan sumber daya terbatas dari node-node WSN, dan hal ini menentukan umur pakai WSN. Oleh karena itu, algoritma dan protokol harus dapat meningkatkan umur pakai WSN, ketahanan sistem terhadap kegagalan, dan kemampuan konfigurasi otomatis. Protokol routing juga penting dalam mengoptimalkan penggunaan energi dan mengurangi overhead jaringan.

4. Sistem Operasi (Operating Systems) Sistem operasi untuk node-node WSN umumnya lebih sederhana daripada sistem operasi umum. Sistem operasi seperti TinyOS, LiteOS, dan Contiki dirancang khusus untuk mendukung WSN dengan menggunakan pendekatan pemrograman yang lebih sederhana dan efisien.

5. Platform Manajemen Data Sensor Kolaboratif Online Platform ini memungkinkan pemilik sensor untuk mendaftarkan dan menghubungkan perangkat mereka untuk mengirim data ke basis data online, sementara pengembang dapat menggunakan data tersebut untuk membangun aplikasi mereka sendiri. Ini memfasilitasi kolaborasi online antara pengguna atas beragam kumpulan data, mulai dari data lingkungan hingga data transportasi.

Simulasi Pemodelan

Saat ini, pemodelan dan simulasi berbasis agen adalah satu-satunya paradigma yang memungkinkan simulasi perilaku kompleks di lingkungan sensor nirkabel (seperti kawanan).[49] Simulasi berbasis agen dari jaringan sensor nirkabel dan ad hoc merupakan paradigma yang relatif baru. Pemodelan berbasis agen awalnya didasarkan pada simulasi sosial. Simulator jaringan seperti Opnet, Tetcos NetSim, dan NS dapat digunakan untuk mensimulasikan jaringan sensor nirkabel.


Disadur dari: en.wikipedia.org/wiki/Wireless_sensor_network

Selengkapnya
Mengulas Mendalam: Jaringan Sensor Nirkabel (WSNs) - Teknologi Canggih untuk Pemantauan Lingkungan dan Industri

Teknik Industri

Menjelajahi Kekuatan Pembelajaran Mesin: Perjalanan Menuju Pembelajaran Data Otonom

Dipublikasikan oleh Muhammad Ilham Maulana pada 02 April 2024


Machine learning (ML) atau Pemelajaran Mesin adalah bagian dari kecerdasan buatan (AI) yang berkaitan dengan pengembangan dan studi algoritme statistik yang dirancang untuk belajar secara mandiri dari data. Algoritme ini kemudian memanfaatkan pembelajaran ini untuk menggeneralisasi dan menangani data baru yang sebelumnya tidak terlihat, sehingga memungkinkan sistem ML untuk melakukan tugas-tugas tertentu tanpa memerlukan instruksi yang telah diprogram secara eksplisit. Dalam beberapa tahun terakhir, jaringan syaraf tiruan generatif telah menunjukkan kinerja yang lebih unggul daripada berbagai pendekatan konvensional di berbagai bidang.

Aplikasi pembelajaran mesin menjangkau berbagai domain, termasuk model bahasa besar (LLM), visi komputer, pengenalan suara, penyaringan email, pertanian, dan kedokteran. Bidang-bidang ini membutuhkan kemampuan untuk menangani tugas-tugas kompleks yang akan menantang dan mahal untuk dikembangkan menggunakan algoritme tradisional. Pembelajaran mesin juga dapat digunakan untuk memecahkan masalah bisnis, yang biasa disebut sebagai analisis prediktif. Meskipun tidak semua algoritme pembelajaran mesin didasarkan pada statistik, statistik komputasi memainkan peran penting dalam bidang ini.

Landasan matematis dari pembelajaran mesin berasal dari metode optimasi matematika. Penambangan data, bidang paralel yang terkait erat, berfokus pada analisis data eksplorasi melalui pembelajaran tanpa pengawasan. Dari perspektif teoretis, kerangka kerja pembelajaran PAC (Probably Approximately Correct) menyediakan model untuk menggambarkan pembelajaran mesin.

Definisi

Mesin yang dimaksud di sini adalah mesin dalam pengertian lebih mendekati kepada ‘sistem’, bukan mesin 'mekanik'. Istilah pemelajaran pertama kali muncul dalam disiplin ilmu kecerdasan buatan. Pemelajaran berarti menambah pengetahuan, memahami dengan belajar, dan mengikuti perintah. Pemelajaran mesin merupakan salah satu cabang dari kecerdasan buatan yang membahas mengenai pembangunan sistem yang didapat berdasarkan pada pemelajaran data, atau sebuah studi yang mempelajari cara untuk memprogram sebuah komputer untuk belajar. Inti dari pemelajaran mesin adalah representasi dan generalisasi. Pada tahun 1959, Arthur Samuel mendefinisikan bahwa pemelajaran mesin adalah bidang studi yang memberikan kemampuan untuk belajar tanpa diprogram secara eksplisit. Kemampuan belajar yang menjadi dominan ditentukan oleh kemampuan perangkat lunak atau alogaritmanya. Implementasi kemampuan belajar dapat dicapai dengan berbagai teknik, ada yang menggunakan kaidah (rule), ada yang menggunakan statistika, ada yang menggunakan pendekatan fisiologi yaitu sistem saraf manusia atau disebut dengan ANN (artificial neural network) atau jaringan saraf tiruan. Pemelajaran mesin dapat berfungsi untuk beradaptasi dengan suatu keadaan yang baru, serta untuk mendeteksi dan memperkirakan suatu pola.

Sejarah

Konsep pembelajaran mesin bermula pada akhir tahun 1950-an ketika Arthur Samuel, seorang karyawan IBM, memperkenalkan istilah tersebut dan membentuk dasar bagi bidang yang revolusioner ini. Namun, perjalanan pembelajaran mesin jauh melampaui kontribusi Samuel, berakar dari puluhan tahun ketertarikan manusia dalam memahami proses kognitif.

Pada akhir tahun 1940-an, karya teoritis psikolog Donald Hebb tentang struktur saraf membuka jalan bagi pengembangan neuron buatan dan prinsip-prinsip dasar yang mendasari algoritma kecerdasan buatan dan pembelajaran mesin. Kolaborator seperti logisian Walter Pitts dan Warren McCulloch memperdalam eksplorasi ini dengan merancang model matematis dari jaringan saraf yang mencerminkan proses berpikir manusia.

Tahun 1960-an menandai titik balik signifikan dengan diciptakannya "mesin pembelajaran" eksperimental seperti Cybertron, yang dirancang oleh Raytheon Company. Sistem-sistem awal ini, dilengkapi dengan memori pita berlubang, meneliti tugas pengenalan pola, membentuk dasar untuk kemajuan di masa depan.

Saat minat dalam pengenalan pola tetap berlanjut ke tahun 1970-an, peneliti seperti Nilsson dan Duda terus menjelajahi potensi pembelajaran mesin, fokus pada klasifikasi dan analisis pola. Pada tahun 1980-an, langkah-langkah besar telah dilakukan dalam memanfaatkan strategi pengajaran untuk melatih jaringan saraf buatan, menunjukkan kemajuan dalam tugas-tugas pengenalan karakter.

Definisi formal algoritma pembelajaran mesin oleh Tom M. Mitchell memberikan kejelasan tentang tujuan bidang ini: meningkatkan kinerja tugas berdasarkan pengalaman. Definisi operasional ini, terinspirasi oleh karya Alan Turing, mengalihkan fokus dari konsep kognitif abstrak ke aplikasi praktis.

Saat ini, pembelajaran mesin melayani dua tujuan: klasifikasi data dan analisis prediktif. Baik itu menggunakan visi komputer untuk mengklasifikasikan melanoma atau memprediksi tren pasar saham, algoritma pembelajaran mesin modern memanfaatkan dataset besar untuk membuat keputusan berbasis informasi dan membentuk masa depan.

Dari awal yang sederhana hingga aplikasi terkini yang canggih, perjalanan pembelajaran mesin mencerminkan upaya manusia yang tak kenal lelah dalam memahami dan memanfaatkan kekuatan sistem cerdas.

Hubungan antara Pembelajaran Mesin dan Bidang Lainnya

Pembelajaran mesin (ML) memiliki akar yang dalam dalam bidang kecerdasan buatan (AI). Pada awalnya, para peneliti dalam AI tertarik pada gagasan membuat mesin belajar dari data. Mereka mengadopsi berbagai metode simbolis dan memperkenalkan jaringan syaraf tiruan, seperti perseptron dan ADALINE, yang pada dasarnya adalah model linear umum dalam statistik. Namun, fokus pada pendekatan logis dan berbasis pengetahuan menyebabkan perbedaan antara AI dan ML. Pada tahun 1980-an, AI didominasi oleh sistem pakar, sementara ML mulai berkembang sebagai bidang yang mandiri, bergantung pada metode statistik dan model, seperti logika fuzzy dan teori probabilitas.

Pembelajaran mesin juga memiliki hubungan yang erat dengan penggalian data. Meskipun keduanya menggunakan metode yang serupa, fokusnya berbeda: ML berusaha untuk membuat prediksi berdasarkan data yang telah diketahui, sementara penggalian data bertujuan untuk menemukan informasi yang sebelumnya tidak diketahui dalam data. Meskipun terdapat kerancuan antara keduanya, keduanya saling melengkapi dan sering menggunakan metode yang sama untuk tujuan yang berbeda.

Selain itu, ML juga berhubungan dengan optimasi matematis. Banyak masalah pembelajaran dirumuskan sebagai masalah optimasi, di mana tujuannya adalah untuk meminimalkan fungsi kerugian pada set pelatihan. Ini menyoroti pentingnya generalisasi dalam ML, di mana tujuannya adalah untuk meminimalkan kerugian pada sampel yang tidak terlihat.

Pentingnya statistik dalam ML juga tidak bisa diabaikan. Meskipun memiliki metode yang mirip, statistik dan ML memiliki tujuan yang berbeda: statistik bertujuan untuk mengambil kesimpulan statistik dari sampel, sementara ML bertujuan untuk menemukan pola prediksi yang dapat digeneralisasi dari data. Beberapa ahli statistik bahkan telah mengadopsi metode dari ML, menciptakan bidang gabungan yang disebut sebagai pembelajaran statistik.

Terakhir, ML juga memiliki keterkaitan dengan fisika. Teknik analitis dan komputasi yang berasal dari fisika dapat diterapkan dalam masalah besar, termasuk ML. Sebagai contoh, fisika statistik dapat digunakan dalam analisis medis diagnostik.

Perbedaan dengan penggalian data

Penggalian data (data mining) merupakan suatu proses yang bertujuan untuk menemukan pengetahuan, kepentingan, dan pola baru dalam data dengan cara menghasilkan model deskriptif, dapat dimengerti, dan prediktif dari data dalam skala besar. Dengan kata lain, data mining adalah ekstraksi atau penggalian pengetahuan yang diinginkan dari volume data yang besar.

Dari definisi tersebut, dapat disimpulkan bahwa pemelajaran mesin berfokus pada studi, desain, dan pengembangan algoritma yang memungkinkan komputer untuk belajar secara mandiri tanpa perlu diprogram secara eksplisit. Di sisi lain, dalam penggalian data, proses dimulai dengan data yang tidak terstruktur, yang kemudian diekstraksi untuk mendapatkan pengetahuan atau pola yang belum diketahui sebelumnya. Selama proses penggalian data ini, algoritma dari pemelajaran mesin digunakan.

Berbagai Tipe Algoritma dalam Pembelajaran Mesin

Dalam dunia pembelajaran mesin, terdapat berbagai tipe algoritma yang dapat dikelompokkan berdasarkan karakteristik masukan dan keluaran yang diharapkan. Mari kita telaah beberapa tipe utama dari algoritma-algoritma ini:

  1. Pemelajaran Terarah (Supervised Learning): Algoritma ini bertujuan untuk membuat fungsi yang memetakan masukan ke keluaran yang diinginkan, contohnya dalam pengelompokan atau klasifikasi. Proses ini dilakukan dengan mempelajari contoh-contoh pasangan masukan-keluaran yang sudah diberikan label. Melalui data latih ini, algoritma berusaha untuk memahami pola-pola yang ada dan menghasilkan model yang mampu melakukan prediksi atau klasifikasi dengan akurasi tinggi.

  2. Pemelajaran Tak Terarah (Unsupervised Learning): Berbeda dengan pemelajaran terarah, algoritma tak terarah ini memodelkan himpunan masukan tanpa disertai keluaran yang tepat. Tujuannya adalah untuk menemukan pola-pola menarik dalam data yang tidak berlabel. Salah satu contoh algoritma tak terarah yang umum adalah clustering, di mana objek-objek yang serupa dikelompokkan dalam area tertentu tanpa adanya label.

  3. Pemelajaran Semi Terarah (Semi-Supervised Learning): Algoritma ini menggabungkan unsur dari supervised dan unsupervised learning. Sebagian contoh masukan-keluaran yang tepat diberikan, sementara sebagian lagi tidak memiliki label. Tujuannya adalah untuk memanfaatkan kelebihan dari kedua tipe pemelajaran untuk menciptakan model yang lebih baik.

  4. Reinforcement Learning: Jenis ini mengajarkan sebuah agen cerdas untuk bertindak dalam suatu lingkungan yang dinamis. Agen ini belajar melalui trial and error, dengan memaksimalkan nilai hadiah atau reward yang diperoleh dari tindakannya. Misalnya, sebuah agen dapat belajar menerbangkan helikopter dengan baik melalui pengalaman-pengalaman negatif seperti menabrak atau melenceng dari jalur tujuan.

  5. Pemelajaran Berkembang (Developmental Learning Algorithm): Bidang ini bertujuan untuk memahami mekanisme pengembangan dan batasan-batasan yang memungkinkan pembelajaran seumur hidup pada mesin. Ini melibatkan pengembangan algoritma yang terbuka terhadap pengetahuan dan kemampuan baru seiring waktu.

  6. Transduction: Mirip dengan supervised learning, tetapi tidak secara eksplisit membangun fungsi. Tujuannya adalah untuk memprediksi output baru berdasarkan pada input baru dan data latih yang tersedia.

  7. Learning to Learn: Algoritma ini menggunakan pembelajaran untuk memahami cara belajar sendiri. Ini melibatkan penggunaan algoritma untuk meningkatkan proses pembelajaran di masa mendatang.

Menjelajahi Berbagai Model dalam Pembelajaran Mesin

Dalam ranah machine learning, model pada dasarnya adalah rumus matematika yang, setelah dilatih pada dataset tertentu, dapat digunakan untuk membuat prediksi atau klasifikasi pada data baru. Selama proses pelatihan, algoritme pembelajaran menyempurnakan parameter internal model untuk meminimalkan kesalahan dalam prediksinya.

Terdapat spektrum jenis model, mulai dari kelas model yang luas dan algoritme pembelajaran yang terkait hingga model yang terlatih sepenuhnya dengan parameter internal yang dioptimalkan. Memilih model yang paling sesuai untuk tugas tertentu sering disebut sebagai pemilihan model.

  • Jaringan Syaraf Tiruan (JST):

Jaringan saraf tiruan, atau JST, adalah sistem komputasi yang terinspirasi oleh struktur jaringan saraf biologis yang saling berhubungan yang ditemukan di otak hewan. Sistem ini belajar melakukan tugas dengan menganalisis contoh tanpa diprogram secara eksplisit dengan aturan khusus tugas. ANN terdiri dari simpul yang saling terhubung, atau neuron buatan, yang memproses dan mengirimkan informasi melalui koneksi berbobot. Jaringan ini telah diterapkan pada berbagai tugas seperti visi komputer, pengenalan suara, dan diagnosis medis.

  • Pohon Keputusan:

Pembelajaran pohon keputusan melibatkan penggunaan pohon keputusan sebagai model prediktif untuk membuat kesimpulan tentang nilai target item berdasarkan pengamatan. Pohon keputusan digunakan dalam statistik, penggalian data, dan pembelajaran mesin, di mana cabang-cabang mewakili gabungan fitur yang mengarah ke label kelas atau nilai target tertentu. Pohon ini efektif untuk memvisualisasikan dan secara eksplisit merepresentasikan proses pengambilan keputusan.

  • Mesin Vektor Pendukung (Support-Vector Machines/SVM):

Support-vector machines adalah metode pembelajaran yang diawasi yang digunakan untuk tugas klasifikasi dan regresi. Mereka membangun model yang memprediksi apakah sebuah contoh baru masuk ke dalam salah satu dari dua kategori berdasarkan sekumpulan contoh pelatihan. SVM dapat secara efisien melakukan klasifikasi non-linear menggunakan trik kernel, memetakan input ke dalam ruang fitur berdimensi tinggi.

  • Analisis Regresi:

Analisis regresi memperkirakan hubungan antara variabel input dan fitur terkait. Regresi linier adalah bentuk yang umum, di mana sebuah garis ditarik agar sesuai dengan data. Model lainnya termasuk regresi polinomial, regresi logistik, dan regresi kernel, yang memperkenalkan non-linearitas untuk menangani masalah non-linear.

  • Jaringan Bayesian:

Jaringan Bayesian adalah model grafis probabilistik yang merepresentasikan variabel acak dan independensi bersyaratnya dengan grafik asiklik berarah. Jaringan ini digunakan untuk memodelkan hubungan antar variabel, seperti penyakit dan gejala, dan dapat menghitung probabilitas kejadian tertentu berdasarkan data yang diamati.

  • Proses Gaussian:

Proses Gaussian adalah proses stokastik di mana distribusi variabel acak adalah normal multivariat. Proses ini digunakan untuk tugas-tugas regresi, di mana output dari titik baru dapat dihitung berdasarkan titik-titik yang diamati dan kovariannya.

  • Algoritma Genetika:

Algoritma genetika meniru proses seleksi alam untuk menemukan solusi untuk masalah optimasi. Algoritme ini menggunakan metode seperti mutasi dan crossover untuk menghasilkan solusi baru untuk mencari hasil terbaik.

  • Fungsi Keyakinan:

Fungsi kepercayaan menyediakan kerangka kerja untuk penalaran dengan ketidakpastian dan memiliki hubungan dengan teori probabilitas. Fungsi ini memanfaatkan metode ensemble untuk menangani batasan keputusan, sampel yang sedikit, dan masalah kelas yang ambigu dalam pembelajaran mesin.

Model pelatihan dalam pembelajaran mesin membutuhkan sejumlah besar data yang dapat diandalkan untuk memastikan prediksi yang akurat. Overfitting, atau mendapatkan model dari data yang bias, dapat menyebabkan prediksi yang miring dan hasil yang merugikan. Mengatasi bias algoritmik dan mengintegrasikan etika pembelajaran mesin adalah pertimbangan penting dalam pelatihan model. Pembelajaran terfederasi adalah pendekatan baru yang mendesentralisasikan proses pelatihan, menjaga privasi pengguna, dan meningkatkan efisiensi.

Manfaat dan implementasi

Pemelajaran mesin menjaganya agar tetap sederhana, sebuah algoritme dikembangkan untuk mencatat perubahan dalam data dan berevolusi dalam desain itu untuk mengakomodasi temuan baru. Seperti diterapkan untuk analisis prediktif, fitur ini memiliki dampak luas mulai pada kegiatan yang biasanya dilakukan untuk mengembangkan, menguji, dan memperbaiki algoritme untuk tujuan tertentu. Aplikasi untuk pemelajaran mesin termasuk:

  • Machine perception
  • Computer vision, including object recognition
  • Natural language processing
  • Syntactic pattern recognition
  • Machine learning
  • Medical diagnosis
  • Bioinformatics
  • Brain-machine interfaces
  • Cheminformatics
  • Detecting credit card fraud
  • Stock market analysis
  • Classifying DNA sequences
  • Sequence mining
  • Speech and handwriting recognition
  • Games
  • Software engineering
  • Adaptive websites
  • Robot locomotion
  • Computational advertising
  • Computational finance
  • Structural health monitoring
  • Sentiment analysis (or opinion mining)
  • Affective computing
  • Menerima Informasi
  • Recommender systems

Penerapan Machine Learning di Masa Depan

Meskipun Machine Learning belum dapat secara efektif memprediksi tingkat kejengkelan pengguna, kami tetap yakin bahwa masih banyak yang dapat dilakukan untuk meningkatkan hasil proyek ini. Pertama-tama, kami menyadari bahwa kumpulan data yang kami miliki masih terbatas untuk metode pemelajaran mesin. Oleh karena itu, kami berencana untuk mengumpulkan lebih banyak data guna melihat apakah penambahan data dapat meningkatkan kinerja model kami secara signifikan.

Selain itu, kami juga berencana untuk mengubah jenis permainan yang digunakan dalam proses pengujian. Mengingat permainan yang digunakan saat ini adalah jenis permainan penembak, terdapat banyak aksi "menembak" yang terlibat. Kami berpendapat bahwa permainan balap mungkin akan lebih efektif dalam mendeteksi gangguan dengan menggunakan sensor gaya, karena dalam permainan balap terdapat lebih banyak tombol yang ditekan dibandingkan dengan permainan penembak. Selain itu, permainan balap juga dapat menghadirkan tingkat stres yang lebih terkait dengan situasi nyata daripada permainan penembak.

Dengan mengambil langkah-langkah ini, kami berharap dapat meningkatkan kemampuan model kami dalam memprediksi tingkat kejengkelan pengguna dengan lebih akurat dan efisien di masa depan.


Disadur dari : id.wikipedia.org/en.wikipedia.org/wiki/Machine_learning

Selengkapnya
Menjelajahi Kekuatan Pembelajaran Mesin: Perjalanan Menuju Pembelajaran Data Otonom

Teknik Industri

Panduan Singkat tentang Klasifikasi Statistik: Jenis, Algoritma, dan Evaluasi

Dipublikasikan oleh Muhammad Ilham Maulana pada 02 April 2024


Dalam statistik, klasifikasi adalah sebuah masalah yang mencoba untuk mengidentifikasi ke dalam salah satu dari beberapa kategori (sub-populasi) sebuah observasi. Contohnya adalah menentukan apakah sebuah email tertentu masuk ke dalam kelas "spam" atau "non-spam", atau menentukan diagnosis untuk seorang pasien berdasarkan karakteristik yang diamati dari pasien tersebut (seperti jenis kelamin, tekanan darah, atau kehadiran atau ketiadaan gejala tertentu).

Observasi-individu sering kali dianalisis menjadi serangkaian properti yang dapat diukur, yang dikenal dengan berbagai istilah seperti variabel penjelas atau fitur. Properti-properti ini bisa berupa kategori, ordinal, bernilai-integer, atau bernilai-real. Klasifikasi juga dapat dilakukan dengan membandingkan observasi dengan observasi sebelumnya melalui fungsi kesamaan atau jarak.

Sebuah algoritma yang mengimplementasikan klasifikasi, terutama dalam implementasi konkretnya, dikenal sebagai klasifier. Istilah "klasifier" kadang juga mengacu pada fungsi matematika, yang diimplementasikan oleh algoritma klasifikasi, yang memetakan data masukan ke dalam kategori.

Terminologi di berbagai bidang cukup beragam. Dalam statistik, di mana klasifikasi sering dilakukan dengan regresi logistik atau prosedur serupa, properti observasi disebut variabel penjelas (atau variabel independen, regressor, dll.), dan kategori yang akan diprediksi disebut sebagai hasil, yang dianggap sebagai nilai-nilai yang mungkin dari variabel dependen. Di machine learning, observasi sering disebut sebagai instance, variabel penjelas disebut fitur (dikelompokkan ke dalam vektor fitur), dan kategori yang mungkin diprediksi disebut sebagai kelas. Bidang lain mungkin menggunakan terminologi yang berbeda: misalnya, dalam ekologi komunitas, istilah "klasifikasi" biasanya mengacu pada analisis klaster.

Klasifikasi dan pengelompokan adalah contoh dari masalah pengenalan pola yang lebih umum, yang merupakan penugasan nilai keluaran tertentu kepada nilai masukan yang diberikan. Contoh lainnya adalah regresi, yang menugaskan nilai nyata ke setiap masukan; penandaan urutan, yang menetapkan kelas ke setiap anggota dari sebuah urutan nilai (misalnya, penandaan bagian pidato, yang menetapkan bagian pidato untuk setiap kata dalam sebuah kalimat masukan); pengurai, yang menetapkan sebuah pohon pengurai ke sebuah kalimat masukan, yang menggambarkan struktur sintaksis dari kalimat tersebut; dll.

Hubungan Dengan Masalah Lain

Sebuah subkelas umum dari klasifikasi adalah klasifikasi probabilistik. Algoritma-algoritma jenis ini menggunakan inferensi statistik untuk menemukan kelas terbaik untuk sebuah instance tertentu. Berbeda dengan algoritma-algoritma lain, yang hanya menghasilkan kelas "terbaik", algoritma probabilistik menghasilkan probabilitas dari instance tersebut menjadi anggota dari setiap kelas yang mungkin. Kelas terbaik biasanya dipilih sebagai kelas dengan probabilitas tertinggi. Namun, algoritma semacam ini memiliki banyak keunggulan dibandingkan dengan klasifier non-probabilistik:

  • Dapat menghasilkan nilai kepercayaan yang terkait dengan pilihannya (secara umum, klasifier yang dapat melakukan ini dikenal sebagai klasifier yang memperhitungkan kepercayaan).
  • Sebagai respons, dapat menahan diri saat kepercayaannya dalam memilih keluaran tertentu terlalu rendah.
  • Karena probabilitas yang dihasilkan, klasifier probabilistik dapat lebih efektif dimasukkan ke dalam tugas-tugas pembelajaran mesin yang lebih besar, dengan cara yang sebagian atau sepenuhnya menghindari masalah penyebaran kesalahan.

Prosedur Yang Sering Dilakukan

Pada awalnya, pekerjaan awal tentang klasifikasi statistik dilakukan oleh Fisher dalam konteks masalah dua kelompok, yang menghasilkan fungsi diskriminan linear Fisher sebagai aturan untuk menetapkan kelompok pada sebuah observasi baru. Pekerjaan awal ini mengasumsikan bahwa nilai data dalam setiap dari dua kelompok memiliki distribusi multivariat normal. Perluasan dari konteks yang sama ini ke lebih dari dua kelompok juga telah dipertimbangkan dengan diberlakukannya batasan bahwa aturan klasifikasi harus linear. Kemudian, pekerjaan untuk distribusi normal multivariat memungkinkan klasifier menjadi non-linear: beberapa aturan klasifikasi dapat diperoleh berdasarkan penyesuaian berbeda dari jarak Mahalanobis, dengan sebuah observasi baru ditugaskan ke kelompok yang pusatnya memiliki jarak terbesar yang disesuaikan dari observasi tersebut.

Prosedur Bayesian

Prosedur Bayesian, berbeda dengan prosedur Frequentist, menyediakan cara alami untuk memperhitungkan informasi yang tersedia tentang ukuran relatif dari berbagai kelompok dalam populasi secara keseluruhan. Prosedur Bayesian cenderung mahal secara komputasi dan, pada masa sebelum komputasi rantai Markov Monte Carlo dikembangkan, aproksimasi untuk aturan pengelompokan Bayesian diperkirakan. Beberapa prosedur Bayesian melibatkan perhitungan probabilitas keanggotaan kelompok: ini memberikan hasil yang lebih informatif daripada atribusi sederhana dari sebuah label kelompok kepada setiap observasi baru.

Klasifikasi Biner Dan Multikelas

Klasifikasi dapat dipikirkan sebagai dua masalah terpisah - klasifikasi biner dan klasifikasi multikelas. Dalam klasifikasi biner, tugas yang lebih dipahami, hanya ada dua kelas yang terlibat, sedangkan klasifikasi multikelas melibatkan penugasan objek ke salah satu dari beberapa kelas. Karena banyak metode klasifikasi telah dikembangkan khusus untuk klasifikasi biner, klasifikasi multikelas seringkali membutuhkan penggunaan gabungan dari beberapa klasifier biner.

Vektor Fitur

Fitur vektor digunakan untuk menggambarkan instance yang kategori-nya akan diprediksi menggunakan serangkaian properti yang dapat diukur dari instance tersebut. Setiap properti disebut fitur, juga dikenal dalam statistik sebagai variabel penjelas (atau variabel independen, meskipun fitur mungkin atau mungkin tidak independen secara statistik). Fitur dapat berupa biner, kategorikal, ordinal, bernilai-integer, atau bernilai-real. Jika instance adalah gambar, nilai fitur mungkin sesuai dengan piksel gambar; jika instance adalah potongan teks, nilai fitur mungkin adalah frekuensi kemunculan kata-kata yang berbeda. Beberapa algoritma hanya bekerja dalam hal data diskrit dan memerlukan bahwa data bernilai-real atau bernilai-integer diskritisasi menjadi kelompok-kelompok.

Classifier algoritma sering kali dibentuk sebagai sebuah fungsi linear yang menetapkan skor untuk setiap kategori mungkin dengan menggabungkan vektor fitur dari sebuah instance dengan sebuah vektor bobot, menggunakan perkalian titik. Kategori yang diprediksi adalah kategori dengan skor tertinggi. Fungsi skor semacam ini dikenal sebagai fungsi prediktor linear dan memiliki bentuk umum berikut:

{\displaystyle \operatorname {score} (\mathbf {X} _{i},k)={\boldsymbol {\beta }}_{k}\cdot \mathbf {X} _{i},}score(Xi​,k)=βk​⋅Xi​

Di mana Xi​ adalah vektor fitur untuk instance i, βk​ adalah vektor bobot yang sesuai dengan kategori  k, dan score (Xi​,k) adalah skor yang terkait dengan menugaskan instance i ke kategori k. Dalam teori pilihan diskrit, di mana instance mewakili orang dan kategori mewakili pilihan, skor tersebut dianggap sebagai utilitas yang terkait dengan orang i memilih kategori k.

Algoritma Klasifikasi Statistik

Algoritma dengan setup dasar ini dikenal sebagai klasifier linear. Yang membedakan mereka adalah prosedur untuk menentukan (pelatihan) bobot/koefisien optimal dan cara interpretasi skor tersebut.

Contoh algoritma semacam ini termasuk:

  • Regresi logistik – Model statistik untuk variabel dependen biner
  • Regresi logistik multinomial – Regresi untuk lebih dari dua hasil diskrit
  • Regresi Probit – Regresi statistik di mana variabel dependen hanya dapat mengambil dua nilai
  • Algoritma perceptron
  • Mesin vektor pendukung – Set metode untuk pembelajaran statistik terawasi
  • Analisis diskriminan linear – Metode yang digunakan dalam statistik, pengenalan pola, dan bidang lainnya

Karena tidak ada bentuk tunggal klasifikasi yang sesuai untuk semua set data, telah dikembangkan berbagai algoritma klasifikasi. Yang paling umum digunakan meliputi:

  • Jaringan syaraf tiruan – Model komputasi yang digunakan dalam pembelajaran mesin, berdasarkan fungsi terhubung dan hierarkis
  • Peningkatan (meta-algoritma) – Metode dalam pembelajaran mesin
  • Pembelajaran pohon keputusan – Algoritma pembelajaran mesin
  • Hutan acak – Metode pembelajaran mesin berbasis pohon pencarian biner
  • Pemrograman genetika – Evolusi program komputer dengan teknik analogi proses genetik alami
  • Pemrograman ekspresi gen – Algoritma evolusioner
  • Pemrograman ekspresi multi
  • Pemrograman genetika linier – jenis algoritma pemrograman genetika
  • Estimasi kernel – Fungsi jendela
  • k-tetangga terdekat – Metode klasifikasi non-parametrik
  • Quantization vektor pembelajaran
  • Klasifikasi linear – Klasifikasi statistik dalam pembelajaran mesin
  • Analisis diskriminan linear Fisher – Metode yang digunakan dalam statistik, pengenalan pola, dan bidang lainnya
  • Regresi logistik – Model statistik untuk variabel dependen biner
  • Klasifier Naive Bayes – Algoritma klasifikasi probabilistik
  • Perceptron – Algoritma untuk pembelajaran terawasi klasifikasi biner
  • Klasifikasi kuadrat – digunakan dalam pembelajaran mesin untuk memisahkan pengukuran dari dua atau lebih kelas objek
  • Mesin vektor pendukung – Set metode untuk pembelajaran statistik terawasi
  • Mesin vektor pendukung kuadrat terkecil

Evaluasi

Kinerja klasifier sangat bergantung pada karakteristik data yang akan diklasifikasikan. Tidak ada klasifier tunggal yang terbaik untuk semua masalah yang diberikan (fenomena yang mungkin dijelaskan oleh teorema tidak ada makan siang gratis). Berbagai uji empiris telah dilakukan untuk membandingkan kinerja klasifier dan untuk menemukan karakteristik data yang menentukan kinerja klasifier. Menentukan klasifier yang sesuai untuk masalah tertentu masih lebih merupakan seni daripada ilmu.

Ukurannya presisi dan recall adalah metrik populer yang digunakan untuk mengevaluasi kualitas sistem klasifikasi. Lebih baru-baru ini, kurva receiver operating characteristic (ROC) telah digunakan untuk mengevaluasi pertukaran antara tingkat positif- dan negatif palsu dari algoritma klasifikasi.

Sebagai metrik kinerja, koefisien ketidakpastian memiliki keuntungan atas akurasi sederhana karena tidak dipengaruhi oleh ukuran relatif dari kelas-kelas yang berbeda. Selanjutnya, itu tidak akan menghukum sebuah algoritma hanya karena mengatur ulang kelas-kelas.

Penerapan Domain Aplikasi

erbagai domain memiliki penerapan klasifikasi yang luas. Dalam beberapa kasus, ini digunakan sebagai prosedur penambangan data, sementara dalam yang lain, pemodelan statistik yang lebih rinci dilakukan.

  • Klasifikasi biologis – Ilmu yang mengidentifikasi, mendeskripsikan, menentukan, dan memberi nama kelompok organisme biologis.
  • Biometrik – Metrik terkait dengan identifikasi karakteristik manusia.
  • Visi komputer – Ekstraksi informasi terkomputerisasi dari gambar.
  • Analisis citra medis dan pencitraan medis – Teknik dan proses pembuatan representasi visual dari dalam tubuh.
  • Pengenalan karakter optik – Pengenalan teks visual oleh komputer.
  • Pelacakan video – Menemukan objek dalam setiap frame urutan video.
  • Skoring kredit – Ekspresi numerik yang mewakili kelayakan kredit seseorang.
  • Klasifikasi dokumen – Proses pengategorian dokumen.
  • Penemuan dan pengembangan obat – Proses membawa obat farmasi baru ke pasar.
  • Toksigenomika – Cabang toksikologi dan genomika.
  • Hubungan struktur-aktivitas kuantitatif – Prediksi kuantitatif aktivitas biologis, ekotoksikologi, atau farmasi dari molekul.
  • Geostatistika – Cabang statistik yang berfokus pada kumpulan data spasial.
  • Pengenalan tulisan tangan – Kemampuan komputer untuk menerima dan menafsirkan input tulisan tangan yang dapat dimengerti.
  • Mesin pencari internet.
  • Klasifikasi mikroarray.
  • Pengenalan pola – Pengenalan otomatis pola dan keteraturan dalam data.
  • Sistem rekomendasi – Sistem penyaringan informasi untuk memprediksi preferensi pengguna.
  • Pengenalan ucapan – Konversi otomatis bahasa lisan menjadi teks.
  • Pemrosesan bahasa alami statistik – Bidang linguistik dan ilmu komputer.


Disadur dari: en.wikipedia.org

 

Selengkapnya
Panduan Singkat tentang Klasifikasi Statistik: Jenis, Algoritma, dan Evaluasi
« First Previous page 70 of 73 Next Last »