"Model AI ini mampu membandingkan beberapa gambar input dan menjawab pertanyaan yang memiliki tingkat kesulitan berbeda," kata Juru Bicara Alibaba.
Alibaba juga menyebutkan Qwen-VL-Chat dapat menjalankan tugas seperti menulis cerita berdasarkan gambar yang diberikan pengguna, serta memecahkan persoalan matematika yang diilustrasikan dalam bentuk gambar.
Salah satu contoh yang diberikan oleh Alibaba adalah ketika diberikan input berupa foto tanda rumah sakit dalam bahasa Tiongkok. AI ini dapat memberikan jawaban mengenai lokasi departemen spesifik dalam rumah sakit dengan menganalisis gambar dari tanda tersebut.
Hingga saat ini, sebagian besar AI generatif lebih terfokus pada tanggapan dalam bentuk teks. Versi terbaru dari ChatGPT milik OpenAI juga memiliki kemampuan untuk memahami gambar dan merespons dengan teks, yang serupa dengan Qwen-VL-Chat.
Dua model terbaru dari Alibaba ini dibangun berdasarkan model bahasa besar (large language models/LLM) perusahaan yang dikenal dengan sebutan Tongyi Qianwen, yang telah dirilis pada awal tahun ini.
Model bahasa besar adalah jenis AI yang dilatih dengan sejumlah besar data dan dijadikan dasar untuk pengembangan aplikasi chatbot.
Selama bulan ini, perusahaan yang berbasis di Hangzhou ini juga telah merilis dua model AI lainnya sebagai sumber terbuka.
Meskipun tidak berdampak pada pendapatan lisensi Alibaba, langkah untuk melepas model-model AI ini sebagai sumber terbuka akan membantu perusahaan untuk memperluas basis pengguna untuk produk AI mereka.
Baca Juga: Incar Pasar SMB, Alibaba Luncurkan Dua LLM AI Sumber Terbuka
Baca Juga: Elon Musk di Mata Bos ChatGPT, Brengsek Tapi Menarik Perhatian