Find Us On Social Media :

Setelah ChatGPT Kini Muncul VALL-E, Artificial Intelligence yang Bisa Tiru Suara Orang dalam 3 Detik

By Rafki Fachrizal, Senin, 16 Januari 2023 | 16:10 WIB

Microsoft VALL-E

Akhir-akhir ini kita diramaikan dengan ChatGPT, teknologi chatbot berbasis AI (Artificial Intelligence) yang bisa diajak mengobrol secara luwes dan mengerjakan tugas yang telah diperintahkan.

Sekarang, muncul lagi teknologi baru berbasis AI yang bernama VALL-E. Dikembangkan oleh raksasa teknologi Microsoft, VALL-E adalah AI text-to-speech yang dapat mereplikasi suara seseorang.

VALL-E menggunakan sampel suara yang direkam selama tiga detik saja untuk kemudian dijadikan sebagai prompt.

Setelah mempelajari sampel suara yang direkam, VALL-E bakal dapat meniru suara dari seseorang tadi untuk mengucapkan kata apapun. Bahkan, kata yang tidak pernah diucapkan oleh si pemilik suara aslinya.

Tidak hanya itu, teknologi AI ini juga mampu mereplikasi emosi dan nada suara yang sudah direkam dari seseorang.

Microsoft menyebut VALL-E sebagai "neural codec language model", dan dibangun dari teknologi yang disebut EnCodec (codec audio yang menggunakan teknik pembelajaran mesin), yang dikembangkan oleh Meta pada 2022.

VALL-E juga dikembangkan dengan algoritme yang mirip dengan algoritme teknologi AI sebelumnya, yaitu DALL-E.

Bedanya, DALL-E memiliki kemampuan yang bisa membuat sebuah gambar hanya berdasarkan sebuah teks.

VALL-E diajarkan menggunakan perpustakaan khusus. Yang terbaru, berisi 60.000 jam pidato bahasa Inggris dari lebih dari 7.000 orang.

Microsoft mengatakan bahwa VALL-E dapat digunakan untuk aplikasi text-to-speech berkualitas tinggi.

Misalnya, dapat digunakan untuk mengedit rekaman suara di mana kata-kata seseorang boleh diubah.

Hasilnya, pengguna dapat membuat konten audio (seperti sulih suara untuk buku audio), dan lainnya.

Potensi Bahaya dari VALL-E

Dikembangkannya VALL-E tentunya membuktikan kemajuan pesat dalam bidang artificial intelligence.

Namun, di sisi lain juga menimbulkan kekhawatiran bagi sebagian pihak lantaran ada potensi bahaya yang dapat ditimbulkan.

Pasalnya, suara seseorang yang direkam menggunakan VALL-E dan direplikasi bisa saja digunakan untuk tindak kejahatan.

Misalnya, VALL-E bisa dimanfaatkan penjahat siber untuk menciptakan deepfake, dengan memakai suara dari politisi atau selebriti kemudian digabungkan dengan foto asli mereka untuk menyebarkan disinformasi atau memicu kemarahan di publik.

Selain itu, Patrick Harr selaku CEO SlashNext, mengatakan bahwa teknologi VALL-E juga bisa menjadi senjata untuk penjahat siber, yang dapat digunakan untuk kampanye vishing – serangan menggunakan panggilan telepon palsu atau pesan suara yang dianggap berasal dari kontak yang diketahui korbannya.

"Teknologi ini bisa sangat berbahaya jika berada di tangan yang salah," kata Harr, sebagaimana dikutip dari The Register.

Para peneliti di Microsoft menyadari potensi resiko berbahaya tersebut. Mereka pun mengatakan akan membuat alat pendeteksi untuk mengetahui apakah sebuah rekaman suara merupakan suara asli pembicaranya atau dibuat menggunakan VALL-E.

"Karena VALL-E dapat mereplikasi ucapan seseorang, ini dapat membawa risiko potensial dalam penyalahgunaan, seperti memalsukan identifikasi suara atau meniru identitas pembicara tertentu. Untuk mengurangi risiko tersebut, dimungkinkan untuk membangun alat deteksi untuk membedakan apakah rekaman suara direplikasi oleh VALL-E. Kami juga akan mempraktikkan Prinsip AI di Microsoft untuk mengembangkan VALL-E lebih lanjut," jelas Microsoft.

Baca Juga: Aktor Ryan Reynolds Bikin Iklan Pakai ChatGPT, Hasilnya Mencengangkan!

Baca Juga: Lagi Viral, Apa Itu ChatGPT dan Bagaimana Cara Menggunakannya?