Oleh Michael Thiotrisno, Country Manager, NetApp Indonesia
[Redaksi]: Dalam beberapa tahun terakhir, AI generatif (Gen AI) telah menjadi salah satu teknologi paling inovatif dan berpotensi besar yang mulai dimanfaatkan oleh banyak perusahaan.Namun, untuk dapat sepenuhnya mengungkap potensi Gen AI, pengelolaan data yang baik dan strategi penerapan yang tepat sangat diperlukan.
AI Generatif (GenAI) adalah salah satu teknologi paling menarik yang telah dimanfaatkan oleh banyak perusahaan dalam beberapa tahun terakhir.
Menurut data Statista, pasar Gen AI di Indonesia akan mencapai US$204,60 juta pada tahun 2024, dengan tingkat pertumbuhan tahunan (CAGR) sebesar 24,4% dari tahun 2024 hingga 2030. Hal ini sejalan dengan banyaknya organisasi di Indonesia yang mulai bereksperimen dan mengeksplorasi kasus-kasus penggunaan potensial yang memanfaatkan teknologi ini.
Dalam Survei Annual Global CEO yang ke 27 oleh PwC, 57% CEO di Indonesia berharap GenAI dapat meningkatkan kepercayaan para pemangku kepentingan. Sedangkan dan 70% responden memperkirakan bahwa kecerdasan buatan atau artificial intelligence (AI) akan mendorong keunggulan daya saing bisnis dalam tiga tahun ke depan.
Sementara itu, meski potensinya sangat besar, potensi AI dan Gen AI sama besarnya dengan potensi data yang menjadi sumber bagi AI itu sendiri. Selain melandasi dan memperkuat Large Language Model (LLM), data tersebut harus diatur dengan baik agar dapat berfungsi secara efektif. Bayangkan data dan GenAI sebagai blok bangunan yang membentuk bagian penting dari gambaran yang lebih besar dari inovasi bisnis.
Untuk membangun fondasi yang kuat yang memungkinkan perusahaan mengungkap nilai data dan memaksimalkan investasi AI mereka, data harus dipersiapkan dengan cermat dan digunakan secara optimal dengan alat yang tepat selama siklus hidupnya.
Aturan 5W-1H
Di banyak perusahaan, sumber data yang paling umum adalah dokumentasi produk internal, riwayat pembelian pelanggan, dan informasi dukungan, dan media, seperti video dan gambar. Agar mesin Gen AI dapat menggunakan berbagai macam data tersebut secara efisien, pengaturan yang tepat sangat penting.
Gunakan cara 5W-1H untuk menyiapkan data:
1. When
Perusahaan harus mengetahui kapan dan seberapa sering data dikumpulkan. Dokumentasi produk internal dibuat saat rilis dan pembaruan produk terjadi. Informasi pelanggan disimpan dalam CRM atau sistem lain sesuai kebutuhan. Dalam kasus video dan audio, file dapat dibuat secara real time. Sebuah sistem harus dibangun untuk segera mengumpulkan data saat data tersebut dibuat.
2. Where
Data ada di banyak tempat. Dokumentasi produk internal diedit di perangkat PC lokal dan dapat disimpan di server file atau secara online di cloud. Informasi pelanggan biasanya disimpan dalam database on-premise atau di cloud. Video dan audio sering kali dihasilkan di edge dan harus dikumpulkan melalui jaringan. Sebuah sistem harus diatur dengan benar untuk mengumpulkan data di setiap lokasi.
3. Who
Kepemilikan berbagai data perlu didefinisikan dengan jelas. Dengan cara ini, pemilik bisnis dan pemangku kepentingan dapat bekerja sama dengan pemiliknya untuk mengelola dan melindungi data mereka dengan lebih baik, dan memastikan penggunaan data yang konsisten.
4. What
Data tersedia dalam berbagai bentuk dan format. Dokumen produk biasanya disimpan dalam format file kantor, seperti Word dan Excel. Sedangkan informasi pelanggan sering disimpan sebagai data terstruktur dalam database. File media, yang tidak terstruktur, termasuk video dan audio. Dengan memahami jenis data yang ditangani, organisasi dapat melakukan pra-pemrosesan dan menganalisisnya secara efektif.
5. Why
Ketika memanfaatkan data untuk AI, masalah yang harus diselesaikan perlu ditentukan sejak awal, agar organisasi dapat memfokuskan perhatian pada data yang paling relevan. Target numerik yang terukur juga harus diidentifikasi dan digunakan untuk memantau kemajuan dari waktu ke waktu.
6. How
Metode yang tepat untuk pengumpulan data harus mempertimbangkan sifat dan lokasi data, misalnya, pengumpulan data di server file menggunakan protokol seperti NFS atau CIFS. Pengumpulan data dari database menggunakan akun yang tepat dan protokol khusus database. Dan untuk pengumpulan data real-time, kemampuan untuk bekerja dengan perangkat edge sangat penting.
Meningkatkan Kecepatan Penerapan
Setelah mengatur data Anda, langkah selanjutnya adalah mempercepat penerapan sistem Gen AI Anda. MLOps adalah kunci untuk menyederhanakan alur kerja dan mempercepat peralihan dari pengembangan AI ke produksi. Pada tahap ini, penting untuk sepenuhnya memanfaatkan infrastruktur penyimpanan organisasi Anda, terutama untuk MLOps dan operasi data termasuk jalur data dan DataOps.
Untuk memfasilitasi penerapan yang lancar dan cepat, fitur-fitur utama sistem penyimpanan perusahaan ini harus Anda manfaatkan:
1. Mengoptimalkan manajemen data perusahaan
Penyimpanan perusahaan memfasilitasi pengumpulan data dari berbagai sumber melalui dukungan multiprotokol, termasuk Network File System (NFS) dan Common Internet File System (CIFS), yang menyederhanakan tugas manajemen penting seperti perlindungan data, pembuatan versi, dan keamanan untuk aplikasi AI. Selain itu, kemajuan terkini dalam dukungan kontainer memungkinkan MLOps dan DataOps. Kemajuan tersebut memungkinkan para data scientist untuk berkonsentrasi pada pengembangan model AI.
2. Memajukan strategi multi hybrid cloud
Penerapan lingkungan hybrid multicloud dan mobilitas data sangat penting, terutama bagi Gen AI dan LLM, yang mengandalkan layanan dan fungsi khusus cloud. Membangun jalur data antara lingkungan lokal dan cloud menawarkan fleksibilitas dan skalabilitas untuk mendukung inisiatif AI. Penyimpanan perusahaan menyediakan fitur yang bekerja dengan penyimpanan objek vendor cloud, atau mengaktifkan mirroring dan caching dalam cloud, yang memfasilitasi strategi hybrid cloud yang disesuaikan untuk perusahaan.
3. Menerapkan langkah-langkah keamanan
Sebagai aset paling berharga dalam suatu organisasi, data terus-menerus terpapar risiko serangan siber. Dengan meningkatnya regulasi dan pengawasan industri di Indonesia, sistem penyimpanan perusahaan yang dilengkapi dengan kemampuan AI dan machine learning, serta fitur keamanan seperti multi-tenancy dan enkripsi akan membantu organisasi memastikan keamanan data melalui deteksi secara real time, sekaligus mengelolanya secara efisien.
Memahami sifat data dan menerapkan langkah-langkah keamanan ini memungkinkan organisasi untuk mendorong transformasi dan memperdalam privasi bisnis.
Mengingat bisnis berada di ujung revolusi AI, data ibarat blok bangunan yang setiap bagiannya berpotensi menghasilkan wawasan transformatif. Namun, organisasi harus terlebih dahulu memahami sifat data yang ingin mereka manfaatkan.
Ketika data bervariasi dan tersebar luas di seluruh lingkungan TI, mekanisme pengumpulan menjadi lebih kompleks. Pendekatan seperti MLOps, dan jalur data serta DataOps, dapat membantu dari perspektif operasional yang berpusat pada AI dan data.
Formula yang unggul dapat dicapai dengan memadukan pendekatan secara tepat untuk mempercepat program Gen AI organisasi. Cara ini pada gilirannya akan membantu organisasi menjadi pemimpin data, unggul dalam persaingan, dan menjadi bagian dari pertumbuhan Indonesia sebagai ekonomi digital terbesar di kawasan ini.
Baca juga: AI Generatif Makin Populer, Ini Contoh Implementasinya di Tiket.com
Baca juga: Gandeng AWS, Infor Permudah Pelanggan Bangun Aplikasi AI Generatif