Menanggulangi kepunahan bahasa daerah, Bappenas RI, GIZ Indonesia, dan Prosa.AI meluncurkan model AI tiga bahasa daerah di Indonesia, yakni bahasa Minangkabau, Bali, dan Bugis.
Karlina Octaviany, AI (Artificial Intelligence) Advisor Fair Forward, GIZ Indonesia, menjelaskan bahwa ada 24 bahasa daerah di Indonesia yang sama sekali tidak memiliki penutur bahasa. Hal tersebut tentu mengundang kekhawatiran Dan menjadi ancaman bagi bahasa daerah di Indonesia.
Untuk itulah, Fair Forward – Artificial Intelligence for All membangun dataset bahasa daerah terbuka sebagai sumber data bagi model-model AI untuk bahasa daerah. Karlina menekankan bahwa langkah ini merupakan awal dari upaya yang lebih luas, dengan harapan akan dikembangkan ke bahasa daerah lainnya di Indonesia. Selain itu, kehadiran AI diharapkan dapat mempercepat perkembangan teknologi di Indonesia.
Ayu Purwarianti, Co-Founder Prosa.AI, mengemukakan alasan pemilihan tiga bahasa daerah tersebut untuk pembangunan data. “Ketiga bahasa ini dipilih atas dasar popularitas penggunaan serta representasi geografis yang luas di Indonesia. Bahasa Bali mewakili wilayah Bali-Sasak-Sumbawa, sementara Minangkabau melambangkan wilayah Malayo-Chamic di Sumatera, dan Bahasa Bugis mewakili Sulawesi Selatan,” jelasnya saat peluncuran Dataset AI Tiga Bahasa Daerah di Gedung STP ITB Bandung pada Senin (22/4/2023), seperti dikutip dari Detik.com.
Ayu menjelaskan bahwa rentang waktu 48 pekan dipersiapkan untuk mencapai target pembangunan data sebesar 10.000.000 kata.
Proses pengumpulan data ini melibatkan banyak pihak, termasuk 108 anotator dari masyarakat setempat (anotator remote) dengan berbagai latar belakang dialek dan jenis pekerjaan, memastikan representasi yang seimbang dari gender. Meskipun menghadapi tantangan seperti kesibukan dan pemadaman listrik, proyek ini berhasil melalui berbagai hambatan dengan hasil yang memuaskan.
Data yang terkumpul kemudian dianalisis dan dipublikasikan pada platform HuggingFace, sehingga memungkinkan akses yang mudah bagi pengembang dan masyarakat umum. Hasil dari pembangunan model juga menunjukkan peningkatan kinerja yang signifikan dibandingkan dengan model dasar sebelum adaptasi.
Andianto Haryoko, Koordinator Ekosistem dan Pemanfaatan TIK dari Bappenas RI, menilai bahasa sebagai aset nasional yang harus dilestarikan. Menurutnya, kegiatan Fair Forward juga berpotensi meningkatkan literasi digital serta transformasi digital yang lebih inklusif di Indonesia.
Melalui kegiatan ini, diharapkan masyarakat dan inovator AI lokal dapat memanfaatkan data bahasa daerah yang tersedia untuk membangun teknologi yang mendukung kebutuhan terkait bahasa daerah.
Baca juga: Prosa Text-to-Speech Versi Terbaru Bisa Ciptakan 40 Variasi Suara
Baca juga: Karya Mahasiswa UNIKOM Tembus Semifinal Microsoft Imagine Cup Global