Prosa.ai meluncurkan versi terbaru produk Text-to-Speech (TTS). Salah satu peningkatan yang diusung adalah jumlah model suara yang lebih banyak dari versi terdahulu.
Untuk terus memperluas jangkauan pasar produk TTS-nya, versi terbaru ini dibekali sepuluh suara baru, termasuk suara Bahasa Inggris, juga mengusung fitur jeda dan custom voice.
Fitur custom voice memungkinkan pengguna menciptakan hingga 40 variasi suara yang berbeda. Selanjutnya, hasil custom voice ini dapat diunduh ke dalam aneka format audio yang mendukung berbagai platform, seperti video YouTube, TikTok, dan media sosial lainnya.
Pada versi sebelumnya yang diluncurkan pada tahun 2021, TTS Prosa.ai menyediakan tiga suara saja, yang terdiri dari satu suara laki-laki dan dua suara perempuan, serta hanya mendukung TTS Bahasa Indonesia.
Selain itu, Prosa.ai juga menciptakan suara yang didesain khusus untuk audiobook berbahasa Indonesia yang diberi nama karakter Dini. Inovasi ini dilatarbelakangi hasil survei terbaru yang dilakukan oleh tim Prosa TTS. Menurut survei tersebut, penggunaan kebutuhan audiobook menempati posisi pertama dengan persentase sebesar 24% dari total generasi audio.
Karakter suara Dini ini dianggap sangat cocok untuk bercerita, karena Dini mempunyai gaya bicara lirih dan penuh penghayatan. Selain itu, akurasi dan prosodi pengucapannya telah ditingkatkan menjadi lebih baik.
Menurut Co-Founder & CEO Prosa.ai.,Teguh Eko Budiarto, teknologi Text-to-Speech bukanlah hal yang baru sehingga Prosa.ai berusaha memberikan keunggulan pada Prosa TTS dibanding produk-produk Text-to-Speech lainnya dengan model-model suara yang unik. Misalnya di versi terbaru ini, Prosa TTS menampilkan beberapa karakter suara yang unik, misalnya suara Dimas (laki-laki) dengan gaya bicara
formal, Dimas dengan gaya bicara ekspresif, dan Ocha (perempuan) dengan gaya bicara ramah.
Model suara Dimas dan Ocha ini, menurut Tegu, cocok untuk pembacaan berita (news narrator) dan voice over.
Prosa Text-to-Speech (TTS) dilengkapi dengan berbagai macam fitur yang memudahkan pengguna, yaitu Speech Synthesizer (penyintesis ucapan) yang membantu memudahkan pengubahan teks tertulis menjadi sebuah ucapan.
Human-sounding Voices merupakan teknologi yang memungkinkan pengguna dapat memilih karakter suara dan gaya bicara manusia yang natural. Voice tuning adalah fitur yang dapat menyesuaikan tinggi rendahnya nada serta mengatur kecepatan berbicara. Terakhir, Flexible Audio File yaitu fitur yang dapat
menghasilkan audio dalam berbagai format (WAV, MP3 dan OPUS) sehingga pengguna dapat memutar, menyimpan atau mengunding audio tersebut.
Dalam hal kinerja, Prosa.ai mengeklaim telah mencatat pertumbuhan dalam jumlah pengguna dan
transaksi sejak diluncurkan pada tahun 2021. Dengan total pengguna hampir mencapai 300 ribu pada awal 2024, meningkat lebih dari 10 kali lipat dalam waktu kurang dari 3 tahun, dengan rata-rata 20 ribu pengguna aktif setiap bulannya, dengan total transaksi untuk paket Prosa TTS mencapai lebih dari 25 ribu sejak pertama kali diluncurkan.
“Kami yakin ruang untuk perkembangan teknologi TTS ini masih sangat besar terutama untuk peningkatan kualitas suara yang semakin natural dan kebutuhannya pun terus meningkat ditandai dengan jumlah volume pencarian teknologi TTS di hasil pencarian Google (SERP) yang kami amati melalui tools web traffic analysis. Fitur lain yang ingin dikembangkan yaitu fitur emosi dalam suara (sedih, marah, takut dll) serta kami ingin mengembangkan marketplace bagi Voice Talent yang ingin menjadi bagian dari suara Prosa TTS danmendapatkan hasil keuntungan dari marketplace ini. Sehingga dapat meningkatkan jumlah
pengguna baru sebesar 2x lipat (YoY) dan jumlah transaksi sebesar 1,5x lipat (YoY) dari tahun sebelumnya,” ujar Teguh Eko Budiarto.