OpenAI dilaporkan menggunakan lebih dari satu juta jam video YouTube untuk melatih model bahasa AI tercanggih AI Sora yang berbasis GPT-4. Tak hanya itu, OpenAI juga mengembangkan sistem transkripsi audio bernama Whisper untuk mengumpulkan data dari video tersebut.
Meskipun menyadari pengawasan, OpenAI tetap melanjutkan praktik tersebut. Kabar ini juga senada dengan laporan bahwa mereka menggunakan data dari video YouTube untuk melatih sistem AI lainnya. Google mengetahui praktik ini tetapi tidak melakukan tindakan karena mereka juga menggunakan video YouTube untuk melatih model AI mereka sendiri.
CEO YouTube, Neal Mohan, menegaskan penggunaan video YouTube oleh OpenAI tanpa izin merupakan pelanggaran terhadap kebijakan layanan platform tersebut. OpenAI juga disorot terkait generator teks-ke-video terbaru mereka, Sora, yang diduga menggunakan video YouTube tanpa izin.
"Penggunaan video YouTube untuk melatih model AI tersebut akan menjadi pelanggaran terhadap syarat penggunaan platform," katanya seperti dikutip Neowin.
Hingga saat ini, OpenAI belum transparan mengenai sumber data Sora, termasuk dari YouTube, Instagram, dan Facebook. Sedangkan Google tampaknya lebih memperhatikan aturan dengan hanya menggunakan video tertentu yang telah mendapat izin dari kreator konten untuk melatih model AI mereka, Gemini
Apple juga dilaporkan membeli jutaan gambar dari Shutterstock untuk melatih model AI mereka guna menghindari pelanggaran hak cipta di masa depan. Penggunaan data tanpa izin dan pelanggaran terhadap kebijakan platform merupakan isu serius yang memunculkan ketidakpastian di industri AI, menyoroti pentingnya menghormati hak cipta dan kebijakan penggunaan data.
Baca Juga: Demi Latih Model AI, Apple Borong Gambar Shutterstock Rp790 Miliar
Baca Juga: Cisco dkk Bentuk Konsorsium Bantu Korban PHK Akibat Disrupsi AI
Penulis | : | Adam Rizal |
Editor | : | Adam Rizal |
KOMENTAR