OpenAI Kembangkan model AI terbaru Voice Engine yang mampu membuat suara sintetis atau kloning suara dengan hanya menggunakan sampel 15 detik. Keunggulan utama Voice Engine adalah kemampuannya yang lebih cepat dibandingkan dengan model AI voice cloning lainnya, yang memerlukan lebih dari satu menit sampel.
Meskipun belum diluncurkan secara resmi, Voice Engine sedang diuji coba dalam skala kecil di beberapa platform, termasuk Age of Learning, platform edukasi. Dengan hanya sampel 15 detik, Voice Engine mampu menghasilkan suara yang sangat mirip dengan suara aslinya.
Pengembangan Voice Engine dimulai oleh OpenAI pada akhir tahun 2022, dan model ini sudah mendukung preset suara untuk API text-to-speech dan fitur Read Aloud dari ChatGPT. Menurut anggota tim produk OpenAI, Voice Engine dilatih menggunakan gabungan data berlisensi dan akan tersedia untuk pengguna umum.
Meskipun OpenAI menyebutkan bahwa Voice Engine hanya akan tersedia untuk sekitar 10 pengembang, rincian lebih lanjut tentang siapa saja pengembangnya dan kapan akan diluncurkan secara publik masih dirahasiakan. Voice Engine terlihat lebih powerful daripada platform text-to-audio AI lainnya seperti ElevenLabs atau Podcastle.
Sebelumnya, OpenAI juga mengumumkan model AI text-to-video yang disebut Sora, yang mampu menciptakan video realistis hanya dengan menggunakan teks. Kabar terbaru menyebutkan bahwa Sora dijadwalkan akan diluncurkan ke publik pada akhir tahun ini.
Buat Film
OpenAI mendorong model artificiaI intelligence (AI) atau kecerdasan buatan AI Sora terlibat dalam pembuatan film di Hollywood. AI Sora memiliki kemampuan hebat yang mampu membuat video berdasarkan perintah teks. Meskipun terbilang baru, Sora dapat menciptakan video panjang dengan kualitas yang tinggi, dan memiliki kemampuan untuk menghasilkan video kompleks dengan berbagai karakter, gerakan, gaya, dan detail subjek yang akurat.
AI Sora dapat menciptakan video yang kompleks dengan sejumlah karakter, jenis gerakan tertentu, gaya tertentu (animasi, video photorealistic, black and white, dll), serta detail subjek dan latar belakang yang akurat. Saat ini CEO dan COO OpenAI sedang melakukan diskusi dengan pihak-pihak terkait di industri film Hollywood. Beberapa sutradara dan aktor ternama telah memiliki akses ke Sora seperti dikutip Mashable.
Namun, upaya OpenAI ini mendapat tentangan dari beberapa pihak di industri film, termasuk serikat penulis dan aktor Hollywood, yang mengkhawatirkan penggunaan AI dalam pembuatan konten yang dapat menggantikan peran penulis dan aktor manusia. Sebab, konten yang dibuat AI Sora bisa saja dipakai selamanya tanpa royalti.
Meskipun ada tanggapan positif dari sejumlah penguji terhadap kemampuan Sora, tanggapan negatif juga muncul di media sosial terkait kekhawatiran akan dampak penggunaan AI dalam industri ini.
Dalam wawancara dengan Wall Street Journal, Chief Technology Officer OpenAI, Mira Murati, mengungkapkan bahwa Sora akan tersedia dalam beberapa bulan mendatang atau kuartal kedua tahun ini atau akhir tahun ini.
Meskipun biaya operasional Sora dikabarkan lebih tinggi daripada model AI lainnya, OpenAI berkomitmen untuk membuatnya tersedia dengan harga yang sama seperti Dall-E, tool generator gambar AI. Seperti halnya dengan Dall-E, Sora kemungkinan akan tersedia secara gratis dengan batasan tertentu, dengan opsi versi berbayar untuk fitur-fitur dan performa yang lebih maksimal.
Sora tidak hanya mampu menghasilkan video realistis berdasarkan prompt teks, tetapi juga dapat membuat video dari gambar, mengedit video, dan memperpanjang video dengan menambahkan atau mengisi frame.
Mampu Bikin Film Keren
OpenAI terus melakukan inovasi di bidang artificial intelligence (AI) atau kecerdasan buatan. Yang terbaru, OpenAI memperkenalkan model AI Sora yang memungkinkan pengguna membuat video berdasarkan permintaan teks sederhana. Tentunya, OpenAI akan terus meningkatkan kemampuan Sora dalam mengolah video termasuk membuat film yang nyata dan mengesankan, tak kalah dengan film buatan manusia.
Salah satu contoh karya Sora yang mencolok adalah video tur museum dengan detail lukisan dan patung yang memukau. Sora mampu menciptakan video dengan alur cerita yang kompleks, seperti cerita alien yang menyamar di Kota New York seperti dikutip Tech Radar.
Video Sora itu mampu menampilkan pergerakan kamera yang realistis dan imajinatif sehingga membuat penonton terpukau. Kemudian, video pendek Sora itu diedit oleh kreator konten Blaine Brown, yang menambahkan adegan alien yang sedang rap dengan sinkronisasi bibir yang sempurna.
Dari hasil video pendek itu membuat semua orang yakin Sora menunjukkan potensi besar dalam industri perfilman. Namun, ada juga kekhawatiran bahwa Sora bisa menggantikan peran manusia dalam pembuatan konten, sehingga perlu dipertimbangkan secara serius oleh para pembuat film dan konten kreator.
Kemampuan Sora AI
OpenAI meluncurkan Sora, sebuah model artificiaI intelligence (AI) atau kecerdasan buatan yang mampu mengubah teks menjadi video. Sora memungkinkan pengguna untuk membuat video fotorealistik hingga satu menit berdasarkan perintah tertulis. Model AI itu akan membantu kelompok atau seniman visual, desainer, dan pembuat film.
“Inilah Sora, model pembuatan video kami. sungguh luar biasa. Kerja luar biasa dari mereka dan tim. Momen yang luar biasa,” tulis CEO OpenAI Sam Altman dalam akun X.
Hebatnya, Sora dapat menciptakan adegan kompleks dengan berbagai karakter, gerakan spesifik, dan detail latar belakang yang akurat. Model AI itu juga dapat memahami objek dalam konteks fisik dan menghasilkan karakter dengan ekspresi emosional yang hidup.
Dengan Sora, pengguna dapat menghasilkan video berdurasi hingga satu menit, menggabungkan adegan mendetail dan banyak karakter. Pengumuman tersebut mencakup klip video yang mengikuti sebuah SUV di sepanjang jalan pegunungan yang berkelok-kelok dan rekaman "sejarah" California selama era demam emas.
Sora dapat menghasilkan video dari gambar diam, memperluas atau mengisi frame yang hilang pada video yang ada. Meskipun sebelumnya model AI seperti Midjourney memimpin dalam transformasi teks menjadi gambar, perusahaan seperti Runway, Pika, dan Lumiere Google juga telah menunjukkan kemajuan yang signifikan dalam domain ini. Mirip dengan Sora, Lumiere memberi pengguna alat teks-ke-video dan juga memungkinkan mereka membuat video dari gambar diam.
OpenAI meminta kepada para pembuat video pengguna Sora untuk memberi label pada video, dengan pedoman C2PA. Sora juga menggunakan metode keamanan yang ada yang diterapkan pada DALL-E yang menolak perintah teks yang tidak pantas atau berbahaya.
Saat ini, Sora masih dievaluasi oleh "red teamers" yang mengevaluasi potensi risiko. OpenAI juga memberikan akses kepada sejumlah seniman visual, desainer, dan pembuat film untuk memberikan umpan balik seperti dikutip The Verge.
OpenAI mengakui bahwa model AI yang ada mungkin tidak selalu akurat dalam mensimulasikan fisika adegan yang kompleks dan mungkin kurang memahami beberapa aspek sebab-akibat. OpenAI baru-baru ini menambahkan watermark ke alat teks-ke-gambar mereka, DALL-E 3 tetapi watermark itu sangat mudah dihapus. Seperti produk AI lainnya, OpenAI harus menghadapi konsekuensi dari kemungkinan penyebaran video AI fotorealistik palsu yang disalahartikan sebagai hal yang nyata.
Terakhir, OpenAI mengatakan akan melibatkan para pembuat kebijakan, pendidik, dan seniman di seluruh dunia untuk memahami kekhawatiran mereka dan mengidentifikasi kasus-kasus positif penggunaan teknologi baru ini.
OpenAI telah mengembangkan alat AI generatif dengan sangat cepat sejak ChatGPT diluncurkan pada November 2022. Sejak itu, kita telah melihat rilis GPT-4, perintah suara dan gambar, model gambar DALL-E 3 baru, semuanya tersedia melalui Obrolan GPT. API OpenAI juga memberikan dampak eksponensial pada industri AI yang memungkinkan perusahaan dan pengembang membuat alat AI generatif mereka sendiri. Kini, OpenAI mengambil langkah besar berikutnya dalam memajukan kemampuan AI dalam pembuatan video.
Baca Juga: Marak Pencurian Kredensial AI Termasuk ChatGPT, Ini Cara Mencegahnya
Baca Juga: Semua Pelanggan X Bakal Kebagian Layanan Chatbot Canggih AI Grok
Penulis | : | Adam Rizal |
Editor | : | Adam Rizal |
KOMENTAR