Microsoft Hadirkan Model AI Dall-E 3 di Microsoft Paint Windows 11

Dall-E 3 ke dalam aplikasi Microsoft Paint Windows 11. Sebelumnya, Microsoft menguji coba Dall-E 3 di Windows 11 Dev Channel. Dall-E 3 sendiri adalah sebuah alat AI generatif yang memungkinkan pengguna membuat gambar dan ilustrasi dengan memberikan instruksi berbasis teks. Fitur ini, dikenal sebagai CoCreator, telah diintegrasikan ke dalam Ms.Paint dan juga Windows 11 baru, Bing Chat atau CoPilot.

Untuk menggunakan Dall-E 3 di Microsoft Paint, pengguna dapat menemukan fitur CoCreator di bagian kanan jendela aplikasi. Di sana, pengguna dapat menuliskan deskripsi gambar yang diinginkan dalam Text Box. CoCreate kemudian menghasilkan tiga opsi gambar sesuai dengan deskripsi tersebut.

Fitur ini gratis namun menggunakan sistem kredit, dengan pengguna mendapatkan 50 kredit poin awal yang setiap satu poinnya dapat digunakan untuk membuat satu gambar. CoCreator telah diluncurkan secara bertahap kepada pengguna Windows 11.

Meskipun saat ini hanya tersedia dalam bahasa Inggris (AS), Microsoft berencana untuk mengembangkan dukungan bahasa lebih lanjut. Perusahaan juga menekankan keamanan privasi dengan menerapkan filtrasi konten untuk mencegah gambar yang merugikan, ofensif, atau tidak pantas.

Banyak Format

OpenAI meluncurkan API baru, termasuk DALL-E 3, model text-to-image yang awalnya hadir di ChatGPT dan Bing Chat. DALL-E 3 menawarkan berbagai opsi format, kualitas, dan resolusi, dengan harga mulai dari USD0,04 per gambar.

Mirip dengan versi DALL-E sebelumnya, API ini menggunakan moderasi bawaan untuk membantu melindungi dari penyalahgunaan. DALL-E 3 menawarkan opsi format, kualitas serta resolusi yang berbeda mulai dari 1024×1024 hingga 1792×1024, dengan harga mulai dari USD0,04 per gambar yang dihasilkan.

DALL-E 3 tidak dapat digunakan untuk membuat versi gambar yang diedit dengan meminta model mengganti beberapa area dari gambar yang sudah ada atau membuat variasi dari gambar yang sudah ada.

Berbeda dengan DALL-E 2, API ini tidak mendukung pembuatan versi gambar yang diedit atau variasi dari gambar yang sudah ada. Dalam pengumuman lain, OpenAI memperkenalkan API text-to-speech, Audio API, dengan enam suara preset yang dapat dipilih. CEO OpenAI, Sam Altman, menyebutnya lebih alami dan membuka peluang penggunaan dalam pembelajaran bahasa dan bantuan suara.

Selain itu, OpenAI meluncurkan versi terbaru dari model pengenalan suara otomatis sumber terbuka, Whisper large-v3, yang diklaim memiliki peningkatan kinerja dalam berbagai bahasa dan tersedia di GitHub.

Di sisi lain, OpenAI kini menyediakan API text-to-speech, Audio API, yang menawarkan enam suara preset — Alloy, Echo, Fable, Onyx, Nova, dan Shimer — untuk dipilih dan dua varian model AI generatif. Ini ditayangkan mulai hari ini, dengan harga mulai dari USD0,015 per masukan 1.000 karakter.

“Ini jauh lebih alami dibandingkan apa pun yang pernah kami dengar di luar sana, yang dapat membuat aplikasi lebih alami untuk berinteraksi dan lebih mudah diakses,” kata CEO OpenAI Sam Altman di atas panggung, dikutip dari TechCrunch.

Penulis	:	Adam Rizal
Editor	:	Adam Rizal