Apa itu Sora?, Model AI OpenAI yang Mampu Ubah Teks Menjadi Video

Adam Rizal - Jumat, 16 Februari 2024 | 15:00 WIB

Ilustrasi ChatGPT.

OpenAI meluncurkan Sora, sebuah model artificiaI intelligence (AI) atau kecerdasan buatan yang mampu mengubah teks menjadi video. Sora memungkinkan pengguna untuk membuat video fotorealistik hingga satu menit berdasarkan perintah tertulis. Model AI itu akan membantu kelompok atau seniman visual, desainer, dan pembuat film.

“Inilah Sora, model pembuatan video kami. sungguh luar biasa. Kerja luar biasa dari mereka dan tim. Momen yang luar biasa,” tulis CEO OpenAI Sam Altman dalam akun X.

Hebatnya, Sora dapat menciptakan adegan kompleks dengan berbagai karakter, gerakan spesifik, dan detail latar belakang yang akurat. Model AI itu juga dapat memahami objek dalam konteks fisik dan menghasilkan karakter dengan ekspresi emosional yang hidup.

Dengan Sora, pengguna dapat menghasilkan video berdurasi hingga satu menit, menggabungkan adegan mendetail dan banyak karakter. Pengumuman tersebut mencakup klip video yang mengikuti sebuah SUV di sepanjang jalan pegunungan yang berkelok-kelok dan rekaman "sejarah" California selama era demam emas.

Sora dapat menghasilkan video dari gambar diam, memperluas atau mengisi frame yang hilang pada video yang ada. Meskipun sebelumnya model AI seperti Midjourney memimpin dalam transformasi teks menjadi gambar, perusahaan seperti Runway, Pika, dan Lumiere Google juga telah menunjukkan kemajuan yang signifikan dalam domain ini. Mirip dengan Sora, Lumiere memberi pengguna alat teks-ke-video dan juga memungkinkan mereka membuat video dari gambar diam.

OpenAI meminta kepada para pembuat video pengguna Sora untuk memberi label pada video, dengan pedoman C2PA. Sora juga menggunakan metode keamanan yang ada yang diterapkan pada DALL-E yang menolak perintah teks yang tidak pantas atau berbahaya.

Saat ini, Sora masih dievaluasi oleh "red teamers" yang mengevaluasi potensi risiko. OpenAI juga memberikan akses kepada sejumlah seniman visual, desainer, dan pembuat film untuk memberikan umpan balik seperti dikutip The Verge.

OpenAI mengakui bahwa model AI yang ada mungkin tidak selalu akurat dalam mensimulasikan fisika adegan yang kompleks dan mungkin kurang memahami beberapa aspek sebab-akibat. OpenAI baru-baru ini menambahkan watermark ke alat teks-ke-gambar mereka, DALL-E 3 tetapi watermark itu sangat mudah dihapus. Seperti produk AI lainnya, OpenAI harus menghadapi konsekuensi dari kemungkinan penyebaran video AI fotorealistik palsu yang disalahartikan sebagai hal yang nyata.

Terakhir, OpenAI mengatakan akan melibatkan para pembuat kebijakan, pendidik, dan seniman di seluruh dunia untuk memahami kekhawatiran mereka dan mengidentifikasi kasus-kasus positif penggunaan teknologi baru ini.

OpenAI telah mengembangkan alat AI generatif dengan sangat cepat sejak ChatGPT diluncurkan pada November 2022. Sejak itu, kita telah melihat rilis GPT-4, perintah suara dan gambar, model gambar DALL-E 3 baru, semuanya tersedia melalui Obrolan GPT. API OpenAI juga memberikan dampak eksponensial pada industri AI yang memungkinkan perusahaan dan pengembang membuat alat AI generatif mereka sendiri. Kini, OpenAI mengambil langkah besar berikutnya dalam memajukan kemampuan AI dalam pembuatan video.