IBM mengambil langkah berani dengan merilis IBM Granite sebagai platform terbuka alias open source. IBM menyebut, langkah ini bertujuan membuat teknologi Artificial Intelligence (AI) lebih terbuka, terjangkau, serta fleksibel untuk bisnis. “Kami percaya pendekatan open source akan mendorong inovasi teknologi AI, seperti yang berhasil dibuktikan Linux dan OpenShift,” ungkap CEO IBM, Arvind Krishna pada acara IBM Think 2024.
“Agar teknologi dapat berkembang cepat dan dapat diakses siapa saja, kita harus menyeimbangkan antara kompetisi, inovasi, dan keamanan. Open source adalah cara tepat mencapai tiga hal tersebut,” tambah Arvind.
Apa Itu IBM Granite
Sebagai informasi, IBM Granite adalah LLM (Large Language Model) buatan IBM yang dirancang khusus untuk keperluan bisnis. Sejak awal, IBM Granite dibekali dengan pembelajaran menggunakan dataset bisnis yang spesifik, seperti laporan finansial, sales, hukum, dan area bisnis lainnya. Hal ini berbeda dengan model LLM lain (seperti ChatGPT atau Bard) yang menggunakan konteks kehidupan sehari-hari.
Selain area pembelajaran yang lebih spesifik, IBM Granite juga lebih selektif dalam penggunaan material untuk belajar. IBM menyebut, IBM Granite memanfaatkan 3-34 miliar parameter yang telah dikurasi dengan teliti. Kurasi ini bertujuan menghilangkan data duplikasi, data berkualitas rendah, mapun data milik pihak lain.
Karena dirancang untuk bisnis, IBM Granite juga difokuskan untuk membantu proses coding. Saat ini, IBM Granite telah dibekali dengan 3-34 miliar parameter, termasuk 116 bahasa pemrograman. Hal ini membuat Granite dapat membantu tugas seputar coding yang rumit seperti modernisasi aplikasi, pembuatan kode, memperbaiki bugs, mendokumentasikan kode, dan masih banyak lagi.
InstructLab, Memudahkan Pengembangan LLM
Masih dalam konteks open source, IBM dan Red Hat juga merilis InstructLab. Ini adalah open source platform untuk melatih sebuah model LLM dengan pengetahuan tambahan secara modular.
Keberadaan InstructLab menjawab tantangan utama pengembangan LLM saat ini, yaitu kompleksitas ketika kita ingin menambahkan kemampuan baru di atas LLM tersebut. Dibutuhkan proses belajar ulang (relearning) untuk keseluruhan model yang membutuhkan waktu dan sumber daya yang besar.
Sedangkan pada InstructLab, proses relearning dilakukan dengan fokus pada instruksi dan contoh dibanding penambahan data baru. Analoginya mirip seperti memberikan murid cara menyelesaikan sebuah soal dan bukan memberikan buku pelajaran.
InstructLab juga dapat memproduksi data sintesis berdasarkan instruksi dan contoh yang kita sodorkan. Hal ini akan mempercepat proses pembelajaran tanpa harus mengumpulkan dataset baru. Dan karena bersifat open source, InstructLab memungkinkan kolaborasi dari banyak pihak saat mengembangkan LLM untuk keahlian tertentu.