Find Us On Social Media :

Google Cloud Tingkatkan Infrastruktur AI, Bakal Tersedia di Asia Tenggara

By Liana Threestayanti, Senin, 4 September 2023 | 17:00 WIB

Google Cloud mengumumkan kemitraan baru dan inovasi produk yang akan membantu bisnis dan organisasi di Asia Tenggara membangun model gen AI. (Foto: Thomas Kurian, CEO Google Cloud)

Di ajang Google Cloud Next '23, Google Cloud mengumumkan kemitraan baru dan inovasi produk yang akan membantu bisnis dan organisasi sektor publik di Asia Tenggara membangun model-model artificial intelligence (AI) berbasis data perusahaan dan mengintegrasikannya dengan aplikasi bisnis yang sudah ada. 

Seperti kita ketahui, pengembangan AI generatif, atau gen AI, membutuhkan infrastruktur yang mumpuni. Untuk kebutuhan tersebut, Google Cloud menyediakan jaringan global yang terdiri dari 38 region yang dijanjikan akan bebas emisi karbon ada tahun 2030. Jaringan global ini mencakup cloud region di Indonesia dan Singapura, dengan cloud region baru akan datang ke Malaysia dan Thailand. 

Google Cloud juga menawarkan infrastruktur yang telah dioptimalkan untuk melatih dan melayani model AI generatif. Dikutip dari Techwire Asia, James Lee, General Manager, Startups & AI, menjelaskan bahwa infrastruktur ini telah dimanfaatkan oleh 70% unicorn AI generatif, seperti Anthropic, Jasper, Cohere, Replit, Runway, dan lain-lain. 

Penambahan TPU, Ketersediaan Superkomputer GPU

Menjawab kebutuhan para pelanggannya ini, Google Cloud mengumumkan sejumlah peningkatan pada infrastruktur AI-nya. Pertama adalah perluasan portofolio infrastruktur dengan menghadirkan Cloud TPU v5e, yang digadang-gadang Google sebagai Cloud TPU paling efisien biaya, scalable, dan serbaguna untuk saat ini. 

TPU v5e menawarkan integrasi dengan Google Kubernetes Engine (GKE), Vertex AI, dan framework seperti PyTorch, JAX, dan TensorFlow, sehingga pengguna lebih memudahkan pengguna dalam menggunakannya. 

Cloud TPU v5e saat ini tersedia sebagai public preview melalui region Las Vegas dan Columbus. Ekspansi ke region-region lain akan segera dilakukan, termasuk ke region Singapura di tahun ini juga. 

Google Cloud juga mengumumkan ketersediaan superkomputer A3 VM yang berbasis GPU NVIDIA H100 mulai bulan depan untuk mendukung pengembangan model-model AI berskala besar. 

A3 VM mengusung prosesor ganda Intel Xeon Scalable generasi ke-4, delapan GPU NVIDIA H100 per mesin virtual, dan host memory sebesar 2TB. Berjalan di platform NVIDIA HGX H100, A3 VM menyuguhkan bisectional bandwidth sebesar 3,6TB/s di antara delapan GPT melalui teknologi NVIDIA NVLink generasi ke-4. 

Di Google Cloud Next '23, Google Cloud dan NVIDIA juga mengumumkan integrasi baru untuk membantu organisasi memanfaatkan teknologi NVIDIA seperti yang digunakan oleh tim riset Google DeepMind dan Google selama dua tahun terakhir.

Inilah beberapa penyempurnaan infrastruktur yang diumumkan Google Cloud:

Google Kubernetes Engine (GKE) Enterprise: Memungkinkan skalabilitas horizontal multi-cluster yang diperlukan untuk beban kerja AI dan machine learning (ML) paling berat dan misi-kritis. Customer sekarang dapat meningkatkan produktivitas pengembangan AI dengan memanfaatkan GKE untuk mengelola beban kerja AI skala besar di Cloud TPU v5e. Selain itu, dukungan GKE untuk A3 VM dengan GPU NVIDIA H100 kini tersedia secara umum.

Cross-Cloud Network: Platform jaringan global ini membantu customer menghubungkan dan mengamankan aplikasi antara cloud dan lokasi on-premises. Selain bersifat terbuka, Cross-Cloud Network juga dioptimalkan untuk workload, hal yang penting untuk kinerja end-to-end saat organisasi mengadopsi AI generatif, dan menawarkan keamanan yang didukung machine learning ML untuk memberikan zero trust.

Penawaran AI baru untuk Google Distributed Cloud (GDC): GDC dirancang untuk memenuhi tuntutan unik organisasi yang ingin menjalankan beban kerja di edge atau di data center. Portofolio GDC akan membawa AI ke edge, dengan integrasi Vertex AI dan penawaran terkelola baru AlloyDB Omni on GDC Hosted.

Peningkatan Vertex AI

Salah satu produk unggulan Google Cloud adalah Vertex AI, platform AI komprehensif yang memungkinkan pelanggan mengakses, menyetel, dan menyebarkan model first-party, third-party, dan open-source, serta membangun dan menskalakan aplikasi AI kelas perusahaan.

Inilah beberapa perluasan yang dilakukan Google Cloud untuk meningkatkan kemampuan Vertex AI. Penamban model pada Model Garden yang meliputi Llama 2 dan Code Llama dari Meta, serta Falcon LLM yang dikembangkan oleh Technology Innovation Institute.

Keragaman pada Model Garden memungkinkan perusahaan menyesuaikan dengan kebutuhannya. Dan ketika pelanggan membutuhkan transparansi terhadap weight dan artifact dari model, untuk kebutuhan compliance dan auditing, pelanggan memiliki opsi open source seperti Llama 2 dan Falcon. 

Google Cloud juga memperbarui beberapa model fondasi first party yang menakup pembaruan PaLM dengan output yang kualitasnya lebih baik, 32.000 token context window yang mampu menganalisis dokumen berukuran lebih besar, kemampuan grounding data enterprise, dan ketersediaan dalam 38 bahasa yang mencakup Bahasa Mandarin Sederhana, Bahasa Mandarin Tradisional, Bahasa Indonesia, Bahasa Thai, dan Bahasa Vietnam.

Kemampuan baru ini akan memungkinkan organisasi di Asia Tenggara membangun aplikasi AI generatif yang lebih baik dalam melayani pengguna dengan bahasa lokal sambil meneguhkan respons dengan data perusahaan mereka sendiri atau korpus pribadi. 

Selain itu model Google Cloud untuk code generation dan chat, Codey, kini menawarkan kinerja yang lebih baik. Bersama model PaLM for Text and Chat, model Codey direncanakan akan dihadirkan di cloud region Singapura tahun ini juga. 

Google Cloud juga meluncurkan watermark digital di Vertex AI untuk memberi perusahaan kemampuan verifikasi terhadap gambar yang dihasilkan AI oleh Imagen. Teknologi ini didukung oleh Google DeepMind SynthID, teknologi untuk menanamkan watermark digital langsung ke dalam gambar piksel, membuatnya tidak terlihat oleh mata manusia dan sangat sulit untuk dirusak tanpa merusak gambar.

Thomas Kurian, CEO, Google Cloud, menegaskan bahwa  mengendalikan data sama pentingnya dengan menemukan dan melatih model yang tepat. 

“Sejak awal, kami merancang Vertex AI untuk memberi Anda kontrol penuh dan pemisahan data, kode, dan kekayaan intelektual Anda, dengan nol kebocoran data. Saat Anda menyesuaikan dan melatih model Anda dengan Vertex AI—dengan dokumen dan data pribadi dari aplikasi SaaS, database, atau sumber kepemilikan lainnya—Anda tidak mengekspos data itu ke model dasar. Kami mengambil snapshot model, memungkinkan Anda melatih dan merangkumnya bersama dalam konfigurasi pribadi, memberi Anda kontrol penuh atas data Anda. Prompt dan data Anda, serta masukan pengguna saat waktu inferensi, tidak digunakan untuk meningkatkan model kami dan tidak dapat diakses oleh pelanggan lain,” jelasnya.

Beberapa organisasi dari berbagai sektor industri di seluruh dunia yang telah memanfaatkan Vertex AI, seperti affable.ai, Aruna, Bank Raykat Indonesia, FOX Sports, GE Appliances, HCA Healthcare, HSBC, Jiva, Kasikorn Business-Technology Group Labs, KoinWorks, The Estée Lauder Companies, the Singapore Government, Mayo Clinic, Priceline, Shopify, Wendy’s, dan lain-lain.

Baca juga: Perluas AI Generatif, Google Rilis Fitur Baru Duet AI di Workspace 

Baca juga: Google DeepMind Identifikasi Gambar Buatan AI dengan Fitur SynthID