OpenAI meningkatkan memberikan pengalaman terbaru kepada pengguna ChatGPT baik yang berbayar maupun yang gratis. Sebelumnya, pengguna ChatGPT Plus menikmati lebih banyak fitur dibandingkan pengguna gratis tetapi sekarang perbedaan tersebut mulai berkurang. Salah satu perubahan besar adalah DALL-E 3, sebuah model AI yang menghasilkan gambar dari deskripsi teks, yang awalnya hanya bisa diakses oleh pengguna ChatGPT Plus, sekarang juga tersedia untuk pengguna gratis.
DALL-E 3 menawarkan peningkatan signifikan dalam hal detail dan resolusi gambar. OpenAI mengumumkan bahwa pengguna ChatGPT gratis dapat membuat hingga dua gambar per hari menggunakan DALL-E 3. Meskipun terbatas, ini tetap memberikan kesempatan bagi pengguna gratis untuk mencoba fitur ini sebelum memutuskan untuk beralih ke versi berbayar.
Sebelumnya, OpenAI juga telah menyediakan fitur DALL-E 3 melalui Copilot bagi pengguna Windows tetapi terbatas pada sistem credits dan hanya bisa diakses oleh pengguna Windows. Selain itu, OpenAI juga memungkinkan pengguna gratis untuk mengakses fitur-fitur lain yang sebelumnya hanya tersedia bagi pengguna berbayar, seperti analisis gambar dan pemrograman, meskipun dengan beberapa batasan harian.
OpenAI meluncurkan API baru, termasuk DALL-E 3, model text-to-image yang awalnya hadir di ChatGPT dan Bing Chat. DALL-E 3 menawarkan berbagai opsi format, kualitas, dan resolusi, dengan harga mulai dari USD0,04 per gambar.
Mirip dengan versi DALL-E sebelumnya, API ini menggunakan moderasi bawaan untuk membantu melindungi dari penyalahgunaan. DALL-E 3 menawarkan opsi format, kualitas serta resolusi yang berbeda mulai dari 1024×1024 hingga 1792×1024, dengan harga mulai dari USD0,04 per gambar yang dihasilkan.
DALL-E 3 tidak dapat digunakan untuk membuat versi gambar yang diedit dengan meminta model mengganti beberapa area dari gambar yang sudah ada atau membuat variasi dari gambar yang sudah ada. Berbeda dengan DALL-E 2, API ini tidak mendukung pembuatan versi gambar yang diedit atau variasi dari gambar yang sudah ada.
Dalam pengumuman lain, OpenAI memperkenalkan API text-to-speech, Audio API, dengan enam suara preset yang dapat dipilih. CEO OpenAI, Sam Altman, menyebutnya lebih alami dan membuka peluang penggunaan dalam pembelajaran bahasa dan bantuan suara.
Selain itu, OpenAI meluncurkan versi terbaru dari model pengenalan suara otomatis sumber terbuka, Whisper large-v3, yang diklaim memiliki peningkatan kinerja dalam berbagai bahasa dan tersedia di GitHub.
Di sisi lain, OpenAI kini menyediakan API text-to-speech, Audio API, yang menawarkan enam suara preset — Alloy, Echo, Fable, Onyx, Nova, dan Shimer — untuk dipilih dan dua varian model AI generatif. Ini ditayangkan mulai hari ini, dengan harga mulai dari USD0,015 per masukan 1.000 karakter.
“Ini jauh lebih alami dibandingkan apa pun yang pernah kami dengar di luar sana, yang dapat membuat aplikasi lebih alami untuk berinteraksi dan lebih mudah diakses,” kata CEO OpenAI Sam Altman di atas panggung, dikutip dari TechCrunch.
Baca Juga: Survei: Pendapatan Perusahaan yang Adopsi AI Generatif Meningkat