OpenAI Bakal Kenalkan Model AI Terbaru 'Strawberry', Ini Kemampuannya

Adam Rizal - Sabtu, 14 September 2024 | 09:00 WIB

Ilustrasi ChatGPT.

OpenAI akan memperkenalkan model AI generatif terbaru dengan kode nama "Strawberry" yang akan hadir pada musim gugur tetapi laporan terbaru menunjukkan bahwa peluncurannya bisa terjadi dalam dua minggu mendatang, lebih cepat dari jadwal.

Strawberry akan fokus pada peningkatan penalaran, berbeda dari model AI lainnya. Model AI itu tidak akan memberikan jawaban secara instan tetapi akan "berpikir" selama 10 hingga 20 detik sebelum merespons. Pendekatan itu akan mengurangi kesalahan dan meningkatkan kemampuan AI dalam menangani tugas-tugas kompleks, seperti pemecahan masalah matematika, pemrograman, dan strategi pemasaran.

Tentunya, Strawberry memiliki beberapa keterbatasan. Saat peluncuran awal, model ini hanya mendukung teks tanpa kemampuan multimodal, dan jeda waktu respons mungkin terasa lambat untuk pertanyaan sederhana. Strawberry akan diintegrasikan ke platform ChatGPT sebagai model tersendiri, meskipun mekanisme pemilihan model oleh pengguna belum dijelaskan.

Model AI itu mungkin memiliki batasan jumlah pesan per jam, dan pengguna kemungkinan harus membayar lebih untuk respons yang lebih cepat. Pengguna ChatGPT Plus dikabarkan akan mendapat akses lebih awal, sebelum model ini tersedia untuk pengguna gratis.

Jika informasi ini benar, Strawberry berpotensi memberikan peningkatan signifikan dalam hal akurasi dan penalaran, meskipun pengguna perlu menyesuaikan diri dengan jeda waktu yang lebih lama sebelum menerima jawaban.

Bikin Chip AI Mandiri

OpenAI sedang mengembangkan chip artificial intelligence (AI) atau kecerdasan buatan mandiri untuk meningkatkan kemampuan model AI generatif teks-ke-video Sora. Menurut sumber internal, OpenAI akan menggandeng TSMC mengembangkan chip AI dengan teknologi fabrikasi 1,6 nm atau Angstrom A16,. Rencananya, OpenAI baru akan memulai produksi massal chip AI itu mulai 2026. Menurut laporan Economic Daily News, awalnya OpenAI meminta TSMC mengembangkan teknologi fabrikasi terbaru tetapi akhirnya mereka memilih menggunakan Angstrom A16.

Nantinya chip AI itu diharapkan dapat meningkatkan kemampuan Sora dalam membuat video dari perintah teks dan membantu integrasi dengan fitur AI dari Apple, yang dikenal sebagai Apple Intelligence. Meski demikian, belum ada tanggapan resmi dari OpenAI maupun Apple terkait laporan ini.

Selain OpenAI, ByteDance, perusahaan induk TikTok, juga dilaporkan sedang mengembangkan chip AI sendiri bekerja sama dengan Broadcom. Chip itu akan diproduksi oleh TSMC dengan fabrikasi 5 nm dan akan digunakan untuk mendukung berbagai fitur AI di aplikasi seperti TikTok, Douyin, dan chatbot mirip ChatGPT bernama Doubao.

Sebelumnya, ByteDance menggunakan chip Nvidia untuk teknologi AI mereka, namun setelah sanksi AS, mereka juga membeli chip Huawei Ascend 910B serta mengalokasikan dana besar untuk pembelian chip Nvidia pada 2023.

Dipakai Hollywood

OpenAI mendorong model artificiaI intelligence (AI) atau kecerdasan buatan AI Sora terlibat dalam pembuatan film di Hollywood. AI Sora memiliki kemampuan hebat yang mampu membuat video berdasarkan perintah teks. Meskipun terbilang baru, Sora dapat menciptakan video panjang dengan kualitas yang tinggi, dan memiliki kemampuan untuk menghasilkan video kompleks dengan berbagai karakter, gerakan, gaya, dan detail subjek yang akurat.

Bikin Chip AI

AI Sora dapat menciptakan video yang kompleks dengan sejumlah karakter, jenis gerakan tertentu, gaya tertentu (animasi, video photorealistic, black and white, dll), serta detail subjek dan latar belakang yang akurat. Saat ini CEO dan COO OpenAI sedang melakukan diskusi dengan pihak-pihak terkait di industri film Hollywood. Beberapa sutradara dan aktor ternama telah memiliki akses ke Sora seperti dikutip Mashable.

Namun, upaya OpenAI ini mendapat tentangan dari beberapa pihak di industri film, termasuk serikat penulis dan aktor Hollywood, yang mengkhawatirkan penggunaan AI dalam pembuatan konten yang dapat menggantikan peran penulis dan aktor manusia. Sebab, konten yang dibuat AI Sora bisa saja dipakai selamanya tanpa royalti.

Meskipun ada tanggapan positif dari sejumlah penguji terhadap kemampuan Sora, tanggapan negatif juga muncul di media sosial terkait kekhawatiran akan dampak penggunaan AI dalam industri ini.

Dalam wawancara dengan Wall Street Journal, Chief Technology Officer OpenAI, Mira Murati, mengungkapkan bahwa Sora akan tersedia dalam beberapa bulan mendatang atau kuartal kedua tahun ini atau akhir tahun ini.

Meskipun biaya operasional Sora dikabarkan lebih tinggi daripada model AI lainnya, OpenAI berkomitmen untuk membuatnya tersedia dengan harga yang sama seperti Dall-E, tool generator gambar AI. Seperti halnya dengan Dall-E, Sora kemungkinan akan tersedia secara gratis dengan batasan tertentu, dengan opsi versi berbayar untuk fitur-fitur dan performa yang lebih maksimal.

Sora tidak hanya mampu menghasilkan video realistis berdasarkan prompt teks, tetapi juga dapat membuat video dari gambar, mengedit video, dan memperpanjang video dengan menambahkan atau mengisi frame.

Mampu Bikin Film Keren

OpenAI terus melakukan inovasi di bidang artificial intelligence (AI) atau kecerdasan buatan. Yang terbaru, OpenAI memperkenalkan model AI Sora yang memungkinkan pengguna membuat video berdasarkan permintaan teks sederhana. Tentunya, OpenAI akan terus meningkatkan kemampuan Sora dalam mengolah video termasuk membuat film yang nyata dan mengesankan, tak kalah dengan film buatan manusia.

Salah satu contoh karya Sora yang mencolok adalah video tur museum dengan detail lukisan dan patung yang memukau. Sora mampu menciptakan video dengan alur cerita yang kompleks, seperti cerita alien yang menyamar di Kota New York seperti dikutip Tech Radar.

Video Sora itu mampu menampilkan pergerakan kamera yang realistis dan imajinatif sehingga membuat penonton terpukau. Kemudian, video pendek Sora itu diedit oleh kreator konten Blaine Brown, yang menambahkan adegan alien yang sedang rap dengan sinkronisasi bibir yang sempurna.

Dari hasil video pendek itu membuat semua orang yakin Sora menunjukkan potensi besar dalam industri perfilman. Namun, ada juga kekhawatiran bahwa Sora bisa menggantikan peran manusia dalam pembuatan konten, sehingga perlu dipertimbangkan secara serius oleh para pembuat film dan konten kreator.

Kemampuan Sora AI

OpenAI meluncurkan Sora, sebuah model artificiaI intelligence (AI) atau kecerdasan buatan yang mampu mengubah teks menjadi video. Sora memungkinkan pengguna untuk membuat video fotorealistik hingga satu menit berdasarkan perintah tertulis. Model AI itu akan membantu kelompok atau seniman visual, desainer, dan pembuat film.

“Inilah Sora, model pembuatan video kami. sungguh luar biasa. Kerja luar biasa dari mereka dan tim. Momen yang luar biasa,” tulis CEO OpenAI Sam Altman dalam akun X.

Hebatnya, Sora dapat menciptakan adegan kompleks dengan berbagai karakter, gerakan spesifik, dan detail latar belakang yang akurat. Model AI itu juga dapat memahami objek dalam konteks fisik dan menghasilkan karakter dengan ekspresi emosional yang hidup

Dengan Sora, pengguna dapat menghasilkan video berdurasi hingga satu menit, menggabungkan adegan mendetail dan banyak karakter. Pengumuman tersebut mencakup klip video yang mengikuti sebuah SUV di sepanjang jalan pegunungan yang berkelok-kelok dan rekaman "sejarah" California selama era demam emas.

Sora dapat menghasilkan video dari gambar diam, memperluas atau mengisi frame yang hilang pada video yang ada. Meskipun sebelumnya model AI seperti Midjourney memimpin dalam transformasi teks menjadi gambar, perusahaan seperti Runway, Pika, dan Lumiere Google juga telah menunjukkan kemajuan yang signifikan dalam domain ini. Mirip dengan Sora, Lumiere memberi pengguna alat teks-ke-video dan juga memungkinkan mereka membuat video dari gambar diam.

OpenAI meminta kepada para pembuat video pengguna Sora untuk memberi label pada video, dengan pedoman C2PA. Sora juga menggunakan metode keamanan yang ada yang diterapkan pada DALL-E yang menolak perintah teks yang tidak pantas atau berbahaya.

Saat ini, Sora masih dievaluasi oleh "red teamers" yang mengevaluasi potensi risiko. OpenAI juga memberikan akses kepada sejumlah seniman visual, desainer, dan pembuat film untuk memberikan umpan balik seperti dikutip The Verge.

OpenAI mengakui bahwa model AI yang ada mungkin tidak selalu akurat dalam mensimulasikan fisika adegan yang kompleks dan mungkin kurang memahami beberapa aspek sebab-akibat. OpenAI baru-baru ini menambahkan watermark ke alat teks-ke-gambar mereka, DALL-E 3 tetapi watermark itu sangat mudah dihapus. Seperti produk AI lainnya, OpenAI harus menghadapi konsekuensi dari kemungkinan penyebaran video AI fotorealistik palsu yang disalahartikan sebagai hal yang nyata.

Terakhir, OpenAI mengatakan akan melibatkan para pembuat kebijakan, pendidik, dan seniman di seluruh dunia untuk memahami kekhawatiran mereka dan mengidentifikasi kasus-kasus positif penggunaan teknologi baru ini.

OpenAI telah mengembangkan alat AI generatif dengan sangat cepat sejak ChatGPT diluncurkan pada November 2022. Sejak itu, kita telah melihat rilis GPT-4, perintah suara dan gambar, model gambar DALL-E 3 baru, semuanya tersedia melalui Obrolan GPT. API OpenAI juga memberikan dampak eksponensial pada industri AI yang memungkinkan perusahaan dan pengembang membuat alat AI generatif mereka sendiri. Kini, OpenAI mengambil langkah besar berikutnya dalam memajukan kemampuan AI dalam pembuatan video.