Find Us On Social Media :

Riset: Hasil Jawaban AI ChatGPT Akurat dan Tidak Terdeteksi Penguji

By Adam Rizal, Jumat, 19 Juli 2024 | 13:00 WIB

Ilustrasi ChatGPT.

Penelitian University of Reading, Inggris, menunjukkan mayoritas jawaban ujian yang dihasilkan chatbot artificial intelligence (AI) atau kecerdasan buatan ChatGPT mendekati kebenaran, akurat dan sangat sulit terdeteksi oleh penguji. Dalam studi tersebut, sekitar 94 persen tugas ujian universitas yang dibuat menggunakan ChatGPT tidak dikenali sebagai hasil karya AI oleh penilai. Bahkan, respons AI mendapatkan nilai lebih tinggi dibandingkan respons siswa asli.

Peter Scarfe (Associate Professor di University of Reading) mengatakan timnya menggunakan ChatGPT untuk menjawab 63 pertanyaan ujian dalam lima modul program studi sarjana psikologi. Ujian tersebut mencakup soal dengan jawaban singkat dan esai panjang, di mana mahasiswa diperbolehkan melihat catatan dan referensi, meskipun penggunaan AI tidak diizinkan. 

Kemudian naskah AI disisipkan di antara tugas yang dikirimkan mahasiswa tanpa pengetahuan penilai. Hasil penelitian menunjukkan bahwa hanya 6 persen pekerjaan AI yang ditandai sebagai kemungkinan bukan karya asli mahasiswa. Beberapa modul bahkan tidak menandai satu pun karya sebagai mencurigakan. 

Scarfe mencatat bahwa AI saat ini masih kesulitan dengan aspek penalaran abstrak dan integrasi informasi, tetapi dari 63 jawaban AI, 83,4 persen di antaranya mengungguli karya siswa. Studi ini dianggap sebagai yang terbesar dan terkuat yang pernah dilakukan dalam konteks ini. Meskipun hanya memeriksa program studi psikologi, Scarfe yakin hasilnya relevan untuk seluruh sektor akademis. Ia menyarankan agar dunia pendidikan mempertimbangkan cara penilaian yang melibatkan AI.

Thomas Lancaster dari Imperial College London juga memperkirakan hasil penelitian ini. Ia menyatakan bahwa AI dapat menghasilkan respons yang tampak masuk akal untuk pertanyaan tekstual sederhana dan terbatas, menunjukkan bahwa penilaian tanpa pengawasan rentan terhadap kecurangan. 

"Beban kerja akademikus yang berat juga mengurangi kemampuan mereka untuk mendeteksi kecurangan AI, dan fenomena ini kemungkinan dialami oleh banyak institusi lainnya," katanya.

Baca Juga: Microsoft SpreadsheetLLM Berbasis AI Mudahkan Pekerjaan Akuntan