Untuk mendukung pekerjaan di bidang farmasi, kedokteran, biologi, dan ilmu kesehatan, peneliti Badan Riset dan Inovasi Nasional (BRIN) mengembangkan sebuah riset mengenai pengembangan model NER (Named Entity Recognition) menggunakan pendekatan multi source.
Slamet Riyanto Peneliti Ahli Madya Pusat Riset Sains Data dan Informasi BRIN menyampaikan dalam paparannya bahwa latar belakang risetnya ini adalah adanya studi literatur yang dilakukan dalam dokumen ilmiah yang tidak terstruktur, mencakup artikel jurnal, review, abstrak, dan laporan.
“Untuk itu perlu adanya metode otomatis dan komputasi yang diperlukan untuk mengekstrak informasi berharga dari data tidak terstruktur,” jelas Slamet pada Webinar Edisi Ke-2 Pusat Riset Sains Data dan Informasi dengan topik "Peran Sains Data dalam Optimisasi Aktivitas Pertanian", Rabu (20/3).
Dalam mengekstraksi informasi berharga dari berbagai data tidak terstruktur yang tersedia dibantu oleh Information Extraction (IE). NER adalah subtugas IE yang melibatkan pengenalan entitas tertentu dalam teks. “NER dalam biomedis bertujuan untuk mengenali dan mengkarakterisasi entitas khusus, seperti chemical, drug, disease, protein, DNA, RNA, dan gen,” terang Slamet.
Slamet menyebutkan bahwa NER memiliki kemampuan untuk memperoleh wawasan berharga dari teks domain khusus. Hal tersebut memungkinkan berbagai aplikasi seperti menganalisis relevansi statistik entitas tertentu seperti disease. Sayangnya belum ada model yang mampu secara akurat mendeteksi entitas plant dan disease dalam sebuah dokumen.
“Pengenalan entitas tanaman dan penyakit bermanfaat sebagai sarana studi literatur untuk mengungkap manfaat dan dampak buruk tanaman terhadap kesehatan manusia,” terang Slamet.
Berdasarkan permasalahan yang telah disebutkan, lanjut Slamet, riset ini melakukan sebuah pengembangan model NER menggunakan pendekatan multi-source transfer learning.
“Model yang dihasilkan adalah Plant-Disease Named Entity Recognition (PDNER) yang dilatih menggunakan multisumber dalam domain biomedis dan botani. Diharapkan model PDNER mampu mengenali entitas tanaman dan penyakit dalam dokumen secara akurat,” ucapnya.
Lebih lanjut Slamet menyampaikan, dalam pengembangannya telah menghasilkan metode otomatis dan komputasi, yang dapat membantu pendekatan studi literatur dalam mendeteksi entitas tumbuhan dan penyakit.
“Preprocessing yang telah dilakukan dan tepat, dapat meningkatkan kinerja model. Sehingga model yang dikembangkan mampu memprediksi entitas pada domain biomedis dan botani secara akurat. Pendekatan multi source transfer learning, dapat membantu mengatasi keterbatasan data berlabel pada target domain,” ungkapnya.
Turut menjadi narasumber dalam webinar ini adalah Taufiq Djatna, Guru Besar Divisi Teknik Sistem dan Industri, Departemen Teknik Industri Pertanian IPB. Ia menyampaikan materinya mengenai The Future of Blockchain in Agriculture.
Sumber: https://brin.go.id/