Prosa.ai meluncurkan versi terbaru produk Text-to-Speech (TTS). Salah satu peningkatan yang diusung adalah jumlah model suara yang lebih banyak dari versi terdahulu.
Untuk terus memperluas jangkauan pasar produk TTS-nya, versi terbaru ini dibekali sepuluh suara baru, termasuk suara Bahasa Inggris, juga mengusung fitur jeda dan custom voice.
Fitur custom voice memungkinkan pengguna menciptakan hingga 40 variasi suara yang berbeda. Selanjutnya, hasil custom voice ini dapat diunduh ke dalam aneka format audio yang mendukung berbagai platform, seperti video YouTube, TikTok, dan media sosial lainnya.
Pada versi sebelumnya yang diluncurkan pada tahun 2021, TTS Prosa.ai menyediakan tiga suara saja, yang terdiri dari satu suara laki-laki dan dua suara perempuan, serta hanya mendukung TTS Bahasa Indonesia.
Selain itu, Prosa.ai juga menciptakan suara yang didesain khusus untuk audiobook berbahasa Indonesia yang diberi nama karakter Dini. Inovasi ini dilatarbelakangi hasil survei terbaru yang dilakukan oleh tim Prosa TTS. Menurut survei tersebut, penggunaan kebutuhan audiobook menempati posisi pertama dengan persentase sebesar 24% dari total generasi audio.
Karakter suara Dini ini dianggap sangat cocok untuk bercerita, karena Dini mempunyai gaya bicara lirih dan penuh penghayatan. Selain itu, akurasi dan prosodi pengucapannya telah ditingkatkan menjadi lebih baik.
Menurut Co-Founder & CEO Prosa.ai.,Teguh Eko Budiarto, teknologi Text-to-Speech bukanlah hal yang baru sehingga Prosa.ai berusaha memberikan keunggulan pada Prosa TTS dibanding produk-produk Text-to-Speech lainnya dengan model-model suara yang unik. Misalnya di versi terbaru ini, Prosa TTS menampilkan beberapa karakter suara yang unik, misalnya suara Dimas (laki-laki) dengan gaya bicara
formal, Dimas dengan gaya bicara ekspresif, dan Ocha (perempuan) dengan gaya bicara ramah.
Model suara Dimas dan Ocha ini, menurut Tegu, cocok untuk pembacaan berita (news narrator) dan voice over.
Prosa Text-to-Speech (TTS) dilengkapi dengan berbagai macam fitur yang memudahkan pengguna, yaitu Speech Synthesizer (penyintesis ucapan) yang membantu memudahkan pengubahan teks tertulis menjadi sebuah ucapan.
Human-sounding Voices merupakan teknologi yang memungkinkan pengguna dapat memilih karakter suara dan gaya bicara manusia yang natural. Voice tuning adalah fitur yang dapat menyesuaikan tinggi rendahnya nada serta mengatur kecepatan berbicara. Terakhir, Flexible Audio File yaitu fitur yang dapat
menghasilkan audio dalam berbagai format (WAV, MP3 dan OPUS) sehingga pengguna dapat memutar, menyimpan atau mengunding audio tersebut.
Penulis | : | Liana Threestayanti |
Editor | : | Liana Threestayanti |
KOMENTAR