OpenAI Luncurkan Dall-E 3 Versi API, Tawarkan Banyak Opsi Format

Adam Rizal - Minggu, 12 November 2023 | 15:30 WIB

OpenAI Luncurkan Mesin AI Dall-E 3, Dapat Membuat Gambar Lewat ChatGPT

OpenAI meluncurkan API baru, termasuk DALL-E 3, model text-to-image yang awalnya hadir di ChatGPT dan Bing Chat. DALL-E 3 menawarkan berbagai opsi format, kualitas, dan resolusi, dengan harga mulai dari USD0,04 per gambar.

Mirip dengan versi DALL-E sebelumnya, API ini menggunakan moderasi bawaan untuk membantu melindungi dari penyalahgunaan. DALL-E 3 menawarkan opsi format, kualitas serta resolusi yang berbeda mulai dari 1024×1024 hingga 1792×1024, dengan harga mulai dari USD0,04 per gambar yang dihasilkan.

DALL-E 3 tidak dapat digunakan untuk membuat versi gambar yang diedit dengan meminta model mengganti beberapa area dari gambar yang sudah ada atau membuat variasi dari gambar yang sudah ada.

Berbeda dengan DALL-E 2, API ini tidak mendukung pembuatan versi gambar yang diedit atau variasi dari gambar yang sudah ada.

Dalam pengumuman lain, OpenAI memperkenalkan API text-to-speech, Audio API, dengan enam suara preset yang dapat dipilih. CEO OpenAI, Sam Altman, menyebutnya lebih alami dan membuka peluang penggunaan dalam pembelajaran bahasa dan bantuan suara.

Selain itu, OpenAI meluncurkan versi terbaru dari model pengenalan suara otomatis sumber terbuka, Whisper large-v3, yang diklaim memiliki peningkatan kinerja dalam berbagai bahasa dan tersedia di GitHub.

Di sisi lain, OpenAI kini menyediakan API text-to-speech, Audio API, yang menawarkan enam suara preset — Alloy, Echo, Fable, Onyx, Nova, dan Shimer — untuk dipilih dan dua varian model AI generatif. Ini ditayangkan mulai hari ini, dengan harga mulai dari USD0,015 per masukan 1.000 karakter.

“Ini jauh lebih alami dibandingkan apa pun yang pernah kami dengar di luar sana, yang dapat membuat aplikasi lebih alami untuk berinteraksi dan lebih mudah diakses,” kata CEO OpenAI Sam Altman di atas panggung, dikutip dari TechCrunch.