Para ahli ETH Zurich berhasil menciptakan robot artificial intelligence (AI) yang digadang-gadang dapat mengalahkan manusia dalam hal keterampilan fisik.
Dan robot AI ini hanya membutuhkan waktu enam jam untuk dapat mempelajari dan memainkan game yang membutuhkan keterampilan fisik.
AI mungkin bisa mengalahkan manusia dalam sejumlah game. Tapi sampai saat ini keterampilan fisik masih menjadi hak prerogatif manusia.
Para peneliti di ETH Zurich mencoba memecahkan persoalan dengan menciptakan robot AI bernama CyberRunner. Robot ini memiliki satu tugas spesifik, yaitu mempelajari cara memainkan game yang populer, kelereng labirin.
Game ini membutuhkan keterampilan fisik untuk mengarahkan kelereng dari titik awal ke titik akhir. Di saat yang sama, sang pemain harus menjaga agar kelereng tidak jatuh ke dalam lubang-lubang yang ada pada papan labirin. Pergerakan kelereng secara tidak langsung dapat dikontrol melalui dua tombol yang dapat mengubah orientasi papan.
Permainan ini relatif mudah, tapi membutuhkan keterampilan motorik halus dan kemampuan penalaran spasial. Dan berdasarkan pengalaman, manusia memerlukan banyak latihan untuk menjadi mahir dalam permainan tersebut.
CyberRunner menerapkan kemajuan terkini dalam reinforcement learning berbasis model ke dunia fisik dan memanfaatkan kemampuannya untuk membuat keputusan berdasarkan informasi tentang potensi perilaku-perilaku yang akan sukses.
Seperti manusia, robot AI ini belajar dari pengalaman. Saat bermain, CyberRunner menangkap observasi dan memperoleh hadiah berdasarkan kinerjanya. Ia memiliki “mata” berupa kamera yang menatap ke arah labirin.
Robot menyimpan kumpulan pengalaman itu di dalam memori. Menggunakan memori ini, algoritma reinforcement learning berbasis model mempelajari perilaku sistem. Dan berdasarkan pemahamannya mengenai game ini, robot mengenali strategi dan perilaku mana yang lebih menjanjikan (“critic”). Akibatnya, cara robot menggunakan dua motor sebagai tangan untuk bermain secara terus menerus diperbaiki.
Robot tidak berhenti bermain untuk belajar. Algoritma terus berjalan bersamaan dengan robot yang memainkan game tersebut. Hasilnya, robot terus menjadi lebih baik, dalam setiap permainannya.
Proses belajar ini berlangsung selama 6,06 jam, terdiri dari 1,2 juta time step pada control rate 55 sampel per detik. Robot AI ini disebut ETH Zurich berhasil mengungguli waktu tercepat yang tercatat sebelumnya, yang dicapai oleh pemain manusia yang sangat terampil, yaitu sebesar lebih dari 6%.
Yang menarik, selama proses pembelajaran, CyberRunner secara alami menemukan jalan-jalan pintas, misalnya, robot menemukan cara untuk 'mengelabui' dengan melewatkan bagian tertentu dari labirin. Peneliti utama, Thomas Bi dan Prof. Raffaello D’Andrea, harus ikut campur dan secara eksplisit menginstruksikan robot untuk tidak mengambil jalan pintas tersebut.
Penulis | : | Liana Threestayanti |
Editor | : | Liana Threestayanti |
KOMENTAR