Find Us On Social Media :

Google Kenalkan VideoPoet AI, Mampu Buat Video dari Deskripsi Teks

By Adam Rizal, Kamis, 4 Januari 2024 | 11:35 WIB

Ilustrasi Google AI

Google meluncurkan merilis produk baru VideoPoet yang mengusung teknologi artificiaI intelligence (AI) atau kecerdasan buatan. Produk ini adalah teknologi di balik generator video yang dapat mengubah perintah berbasis teks menjadi video berkualitas tinggi dalam hitungan detik.

Pengguna dapat memberikan perintah seperti "Robot kucing yang sedang makan spageti," dan VideoPoet akan membuat video sesuai perintah tersebut. Selain itu, VideoPoet dapat mengedit video, memotong, menggabungkan, mengubah gambar menjadi video, dan melakukan berbagai modifikasi termasuk efek pada background.

Dikembangkan oleh peneliti AI Google, VideoPoet dilatih menggunakan satu miliar pasang gambar-teks dan 270 juta sampel video publik. Melalui proses pra-pelatihan yang melibatkan penerjemahan gambar, bingkai video, dan klip audio, VideoPoet dapat memprediksi video yang cocok dengan perintah teks pengguna. Google mengklaim bahwa VideoPoet mampu menghasilkan video durasi panjang dibandingkan dengan kompetitor seperti proyek Make-A-Video milik Meta.

Untuk memperlihatkan kemampuannya, Google menunjukkan film pendek tentang seekor rakun yang terdiri dari klip-kilp pendek yang dihasilkan oleh VideoPoet. Namun, ketersediaan VideoPoet untuk publik belum diungkap, dan saat ini belum dapat diuji langsung oleh pengguna. Meskipun memiliki sejumlah kemampuan, VideoPoet tetap dianggap sebagai alat terbatas jika dibandingkan dengan video profesional.

Chatbot AI

Gemini juga diuji oleh CEO Google, Sundar Pichai, yang memberikan testimoni bahwa Bard dengan Gemini membawa peningkatan signifikan dalam penalaran, perencanaan, dan pemahaman. Google mengklaim bahwa Gemini memiliki kinerja multimodal, mampu memahami teks, gambar, video, audio, dan lainnya. Dalam uji MMLU, Gemini Ultra unggul dalam berbagai mata pelajaran dibandingkan GPT-4, menunjukkan skor di atas 90 persen. Sedangkan, GPT-4 dengan skor 86,4 persen.

Gemini Ultra juga melampaui GPT-4 dalam aspek penalaran multifase, pemahaman membaca, kemampuan matematika, dan kemampuan coding. Google membagikan video yang menunjukkan Bard dengan Gemini membantu mengerjakan tugas fisika, menanggapi foto tugas dengan jawaban lengkap dan langkah demi langkah. Kerjasama dengan YouTuber Mark Rober juga memperlihatkan kemampuan Gemini Pro dalam membuat pesawat kertas secara detail.

Yakin Kalahkan ChatGPT

Google mulai mengerjakan proyek ambisius artificiaI intelligence (AI) atau kecerdasan buatan Gemini AI untuk menantang chatbot AI GPT-4 dan Microsoft Bing Chat. Google menaruh ekspektasi tinggi ke Gemini AI bakal mengalahkan GPT-4 mengingat Gemini AI berbasis AlphaGo dan model bahasa yang besar. Tentunya, pengembangan Gemini AI memerlukan waktu beberapa bulan dan menghabiskan biaya puluhan atau ratusan juta dolar. Nantinya, Gemini AI akan menggunakan algoritma pembelajaran mesin canggih untuk memahami bahasa alami dan merespons pertanyaan pengguna.

Data pelatihan yang luas memberi Gemini keunggulan karena Google memiliki akses ke banyak informasi untuk melatih modelnya. Selain menghasilkan teks seperti GPT-4, Gemini juga bisa membuat gambar berdasarkan deskripsi teks dan melakukan berbagai tugas lainnya seperti analisis data dan pengontrolan perangkat lunak.

Sistem AI Google juga memiliki kemampuan baru, seperti perencanaan atau pemecahan masalah, yang lebih mampu daripada GPT-4 OpenAI. Gemini AI diharapkan memberi daya pada berbagai layanan. Ini termasuk chatbot dan aplikasi perusahaan dan itu bisa menjadi saingan yang layak di pasar.

Google akan mengintegrasikan Gemini AI ke chatbot Google Bard dan Google Cloud untuk mampu bersaing dengan produk pesaing seperti Microsoft Azure. Gemini sendiri adalah keluarga baru model bahasa besar (LLM) yang dikembangkan Google untuk bersaing dengan chatbot AI lainnya seperti Microsoft Bing Chat dan ChatGPT OpenAI.

“Pada level tinggi, Anda dapat menganggap Gemini sebagai kombinasi dari beberapa keunggulan sistem tipe AlphaGo dengan kemampuan bahasa yang luar biasa dari model besar," kata Demis Hassabis, co-founder DeepMind dan CEO Google DeepMind, dikutip dari Gizchina.

Gemini akan didukung oleh algoritme pembelajaran mesin canggih yang memungkinkannya memahami bahasa alami dan menanggapi pertanyaan pengguna dengan percakapan. Data pelatihan Google yang luas dapat memberi Gemini keunggulan dalam perlombaan senjata AI. Ini karena perusahaan memiliki akses ke banyak informasi yang dapat digunakan untuk melatih modelnya.

Menurut IT Home, Gemini AI Google menggabungkan pembuatan teks mirip GPT-4 tetapi menambahkan lebih banyak. Laporan tersebut mengklaim bahwa sistem juga mendukung "pembuatan gambar berdasarkan deskripsi teks".

Dengan demikian, alat AI ini mampu mewujudkan dialog obrolan, menganalisis data bagan, membuat gambar, dan bahkan mengontrol perangkat lunak dengan perintah bahasa alami.

Baca Juga: Samsung Fokus Kembangkan Teknologi AI Generatif Tahun Ini

Baca Juga: Rekomendasi Aplikasi AI Terbaik untuk UMKM di Indonesia, Ada ChatGPT