Para ahli ETH Zurich berhasil menciptakan robot artificial intelligence (AI) yang digadang-gadang dapat mengalahkan manusia dalam hal keterampilan fisik.
Dan robot AI ini hanya membutuhkan waktu enam jam untuk dapat mempelajari dan memainkan game yang membutuhkan keterampilan fisik.
AI mungkin bisa mengalahkan manusia dalam sejumlah game. Tapi sampai saat ini keterampilan fisik masih menjadi hak prerogatif manusia.
Para peneliti di ETH Zurich mencoba memecahkan persoalan dengan menciptakan robot AI bernama CyberRunner. Robot ini memiliki satu tugas spesifik, yaitu mempelajari cara memainkan game yang populer, kelereng labirin.
Game ini membutuhkan keterampilan fisik untuk mengarahkan kelereng dari titik awal ke titik akhir. Di saat yang sama, sang pemain harus menjaga agar kelereng tidak jatuh ke dalam lubang-lubang yang ada pada papan labirin. Pergerakan kelereng secara tidak langsung dapat dikontrol melalui dua tombol yang dapat mengubah orientasi papan.
Permainan ini relatif mudah, tapi membutuhkan keterampilan motorik halus dan kemampuan penalaran spasial. Dan berdasarkan pengalaman, manusia memerlukan banyak latihan untuk menjadi mahir dalam permainan tersebut.
CyberRunner menerapkan kemajuan terkini dalam reinforcement learning berbasis model ke dunia fisik dan memanfaatkan kemampuannya untuk membuat keputusan berdasarkan informasi tentang potensi perilaku-perilaku yang akan sukses.
Seperti manusia, robot AI ini belajar dari pengalaman. Saat bermain, CyberRunner menangkap observasi dan memperoleh hadiah berdasarkan kinerjanya. Ia memiliki “mata” berupa kamera yang menatap ke arah labirin.
Robot menyimpan kumpulan pengalaman itu di dalam memori. Menggunakan memori ini, algoritma reinforcement learning berbasis model mempelajari perilaku sistem. Dan berdasarkan pemahamannya mengenai game ini, robot mengenali strategi dan perilaku mana yang lebih menjanjikan (“critic”). Akibatnya, cara robot menggunakan dua motor sebagai tangan untuk bermain secara terus menerus diperbaiki.
Robot tidak berhenti bermain untuk belajar. Algoritma terus berjalan bersamaan dengan robot yang memainkan game tersebut. Hasilnya, robot terus menjadi lebih baik, dalam setiap permainannya.
Proses belajar ini berlangsung selama 6,06 jam, terdiri dari 1,2 juta time step pada control rate 55 sampel per detik. Robot AI ini disebut ETH Zurich berhasil mengungguli waktu tercepat yang tercatat sebelumnya, yang dicapai oleh pemain manusia yang sangat terampil, yaitu sebesar lebih dari 6%.
Yang menarik, selama proses pembelajaran, CyberRunner secara alami menemukan jalan-jalan pintas, misalnya, robot menemukan cara untuk 'mengelabui' dengan melewatkan bagian tertentu dari labirin. Peneliti utama, Thomas Bi dan Prof. Raffaello D’Andrea, harus ikut campur dan secara eksplisit menginstruksikan robot untuk tidak mengambil jalan pintas tersebut.
“Sebelum CyberRunner, hanya organisasi dengan anggaran besar dan infrastruktur eksperimental yang dibuat khusus yang dapat melakukan penelitian di bidang ini. Kini, dengan biaya kurang dari 200 dolar, siapa pun dapat terlibat dalam penelitian AI mutakhir. Selain itu, setelah ribuan CyberRunner hadir di dunia nyata, mereka dapat terlibat dalam eksperimen skala besar, di mana pembelajaran terjadi secara paralel, dalam skala global,” jelas Prof Raffaello D’Andrea.
Pracetak makalah penelitian tersedia di situs proyek, www.CyberRunner.ai. Selain itu, Thomas Bi dan Prof Raffaello D’Andrea akan membuka proyek tersebut menjadi open source dan menyediakannya di situs web.
Baca juga: OpenAI Buat Kerangka Kerja Keselamatan Pengembangan Model AI