Alibaba berhasil menempati posisi pertama dalam Papan Peringkat VQA (Visual Question Answering) global terbaru yang sekaligus menorehkan sejarah baru berupa terlampauinya kemampuan manusia oleh kinerja mesin.
Ya, untuk pertama kalinya mesin mampu mengungguli manusia dalam memahami gambar untuk menjawab pertanyaan teks. Algoritme Alibaba yang tertanam pada model AI bernama AliceMind berhasil mencapai tingkat akurasi hingga 81,26% dalam menjawab pertanyaan terkait gambar, dibandingkan dengan kinerja manusia yang hanya mencapai 80,83% (pada bagian standar pengujian).
Tantangan yang diselenggarakan setiap tahun sejak 2015 oleh CVPR, konferensi visual terkemuka di seluruh dunia ini menarik minat para pemain industri global, termasuk Facebook, Microsoft, dan Universitas Stanford. Dalam tantangan tersebut disajikan gambar dan pertanyaan terkait bahasa natural (natural language), dan para peserta diminta menjawab secara akurat dengan Bahasa yang natural. Tahun ini, tantangan yang diberikan berjumlah lebih dari 250.000 gambar dan 1,1 juta pertanyaan.
Terobosan kecerdasan mesin dalam menjawab pertanyaan terkait gambar itu dapat terwujud berkat desain algoritme inovatif dari Alibaba DAMO Academy, inisiatif penelitian dan pengembangan global Alibaba Group. Dengan memanfaatkan teknologinya, termasuk representasi visual yang beragam, model bahasa pra-latihan multimodal, perpaduan semantik lintas-modal yang adaptif dan penyelarasan teknologi, tim Alibaba mampu membuat kemajuan yang signifikan tidak hanya dalam menganalisis gambar dan memahami maksud dari pertanyaan, tetapi juga memberikan jawaban dengan alasan yang tepat dan mengungkapkannya dalam gaya percakapan seperti manusia.
Pemanfaatan VQA
Teknologi VQA sendiri telah diterapkan secara luas di seluruh ekosistem Alibaba. Misalnya, fitur chatbot cerdas Alibaba, Alime Shop Assistant, yang digunakan oleh puluhan ribu pedagang di platform ritel Alibaba.
“Kami bangga dapat mencapai tonggak keberhasilan lainnya dalam kecerdasan mesin, yang menggarisbawahi upaya berkelanjutan kami dalam mendorong penelitian dan pengembangan di bidang AI terkait,” ujar Si Luo, Head of Natural Language Processing (NLP), Alibaba DAMO Academy.
Namun dengan adanya teknologi ini, bukan berarti manusia akan digantikan oleh robot suatu hari nanti. "Sebaliknya, kami yakin bahwa mesin yang lebih cerdas dapat digunakan untuk membantu pekerjaan dan kehidupan sehari-hari, sehingga, manusia dapat berfokus pada tugas-tugas kreatif yang paling mereka kuasai,” lanjut Si Luo.
Si Luo menjelaskan, VQA dapat digunakan di berbagai area, misalnya, saat mencari produk di situs e-commerce, untuk mendukung analisis gambar medis pada diagnosis penyakit awal, serta untuk teknologi mengemudi cerdas. "Karena asisten AI akan secara otomatis menawarkan analisis dasar foto yang diambil oleh kamera dalam mobil,” papar Si Luo.
Sebelumnya model Alibaba juga menduduki puncak peringkat benchmark GLUE, sebuah tabel industri yang dianggap sebagai tes dasar paling penting untuk model NLP.
Pada tahun 2019, model Alibaba melampaui nilai manusia ketika diuji oleh dataset Microsoft Machine Reading Comprehension, salah satu tes paling menantang di dunia kecerdasan buatan untuk pemahaman bacaan. Model Alibaba berhasil mendapat skor 0,54 dalam tugas tanya jawab MS Marco, mengungguli skor manusia 0,539, sebuah tolok ukur yang disediakan oleh Microsoft.
Pada tahun 2018, Alibaba juga mendapat skor lebih tinggi dari tolok ukur manusia di Stanford Question Answering Dataset – yang merupakan salah satu tantangan pemahaman membaca mesin paling populer di seluruh dunia.
Prestasi yang diraih AliceMind secara signifikan ini menandai tonggak penting dalam pengembangan sistem pemahaman bahasa secara natural yang kuat.
Penulis | : | Liana Threestayanti |
Editor | : | Liana Threestayanti |
KOMENTAR