Find Us On Social Media :

Pendiri OpenAI ChatGPT Bongkar Kelemahan Respons Jawaban Chatbot AI

By Adam Rizal, Sabtu, 16 Desember 2023 | 15:00 WIB

Ilustrasi ChatGPT.

Andrej Kaparthy (Salah seorang Pendiri  OpenAI) menyoroti kelemahan sistem chatbot artificiaI intelligence (AI) atau kecerdasan buatan yang signifikan dan harus segera diatasi terutama saat chatbot AI itu memberikan jawaban yang mengada-ada untuk memuaskan pelanggannya.

Dilansir dari Neowin, Andrej menyatakan  respons semacam itu adalah hal yang wajar karena chatbot AI bergantung pada Large Language Models (LLM). Artinya, setiap bahasa atau respons yang disajikan oleh sistem ini hanyalah upaya untuk memuaskan pelanggan, meskipun kadang informasinya tidak valid.

"Sangat wajar sebuah chatbot AI memberikan jawaban yang tidak akurat karena chatbot AI adalah "mesin impian," di mana seluruh jawabannya merupakan hasil halusinasi dari LLM," katanya.

Meskipun Andrej tidak menyangkal bahwa chatbot AI dapat menciptakan halusinasi, ia tidak menganggapnya sebagai bug. Sebaliknya, ia melihat hal tersebut sebagai keunikan dari output yang dapat dihasilkan oleh LLM.

“Dalam beberapa hal, halusinasi adalah semua yang dilakukan LLM. Mereka adalah mesin impian,” ungkap Andrej  Karpathy dalam unggahan di X.

Namun, Andrej menekankan bahwa pengguna chatbot AI seharusnya menyadari konsep ini. Dengan menyadari adanya halusinasi yang dihasilkan oleh chatbot AI, pengguna diharapkan dapat mengantisipasinya dengan selalu memeriksa ulang setiap informasi atau respons yang diberikan oleh mesin tersebut.

Jago Kasih Nasihat

Sebuah studi terbaru mengungkapkan kemampuan chatbot AI, ChatGPT, yang disebut lebih mumpuni daripada manusia dalam hal memberikan nasihat pribadi. Ketika ChatGPT diperkenalkan OpenAI setahun lalu, teknologi artificial intelligence (AI) pun sontak menjadi perhatian masyarakat sehingga popularitasnya juga terangkat. 

Masyarakat pun lantas mengeksplorasi dan menguji sejauh mana kemampuan si chatbot AI itu dalam membantu tugas mereka sehari-hari. Dunia bisnis pun mulai melirik seiring diperkenalkannya berbagai tool AI generatif untuk berbagai kebutuhan perusahaan, seperti pengembangan software, pemasaran, alat produktivitas dan sebagainya. 

Sebuah studi pada Frontiers in Psychology mengungkapkan, ditopang oleh model GPT-4, kemampuan ChatGPT dalam memberikan nasihat pribadi terbukti lebih mumpuni daripada manusia. Sementara pada umumnya, orang percaya bahwa untuk memberikan nasihat yang bersifat pribadi, dibutuhkan empati mansia. 

Dalam studi tersebut, sekitar tiga perempat dari responden mengatakan, jika dibandingkan dengan manusia, nasihat dari ChatGPT lebih imbang, lengkap, berempati, dan membantu. Temuan ini memperlihatkan satu pergeseran yang signifikan pada kemampuan AI untuk memahami dan merespons emosi manusia. 

Dibandingkan dengan GPT-3.5, GPT-4 disebut memiliki kemampuan yang lebih baik dalam menghadapi hal-hal yang berkaitan dengan emosi. Kemajuan ini tentu akan meningkatkan kemampuan ChatGPT dalam memberikan respons yang lebih berempati dan bisa diterima secara sosial.

Sebelumnya, tim peneliti dari Microsoft, William & Mary, dan pusat penelitian di Asia, telah melakukan penelitian untuk melihat apakah LLM (model bahasa besar) dapat memahami emosi manusia. Studi tersebut menemukan bahwa LLM, yang melandasi tool AI generatif, seperti ChatGPT, berpotensi "dapat memahami dan merespons isyarat emosional."

Kinerja Meningkat dalam Dua Kali Uji

Penelitian ini menggunakan Levels of Emotional Awareness Scale (LEAS) sebagai tes berbasis kinerja yang obyektif untuk menganalisis respons ChatGPT terhadap 20 skenario. Kemudian para ahli membandingkan kinerja Emotional Awareness (EA) chatbot AI tersebut dengan EA dari norma-norma masyarakat secara umum. 

Satu bulan kemudian, para ahli kembali melakukan uji, yang berupa penilaian perbaikan EA dari waktu ke waktu. kemudian dua psikolog independen dan berlisensi diminta mengevaluasi kesesuaian konteks dari respons-respons EA ChatGPT.

Dalam uji pertama, ChatGPT memperlihatkan kinerja yang lebih tinggi pada semua skala LEAS (Z score = 2,84) jika dibandingkan kinerja populasi secara umum. Dan pada uji kedua, kinerja chatbot AI ini memperlihatkan peningkatan yang signifikan, bahkan nyaris mencapai skor LEAS maksimal yang mungkin (Z score = 4,26). Tingkat akurasinya juga relatif tinggi (9,7/10). 

Sebagai hasilnya, para ahli menyimpulkan bahwa ChatGPT dapat menghasilkan respons emotional awareness yang sesuai dan kinerjanya dapat meningkat dari waktu ke waktu.