Google Cloud Tingkatkan Infrastruktur AI, Bakal Tersedia di Asia Tenggara

Google Cloud mengumumkan kemitraan baru dan inovasi produk yang akan membantu bisnis dan organisasi di Asia Tenggara membangun model gen AI. (Foto: Thomas Kurian, CEO Google Cloud)

Di ajang Google Cloud Next '23, Google Cloud mengumumkan kemitraan baru dan inovasi produk yang akan membantu bisnis dan organisasi sektor publik di Asia Tenggara membangun model-model artificial intelligence (AI) berbasis data perusahaan dan mengintegrasikannya dengan aplikasi bisnis yang sudah ada.

Seperti kita ketahui, pengembangan AI generatif, atau gen AI, membutuhkan infrastruktur yang mumpuni. Untuk kebutuhan tersebut, Google Cloud menyediakan jaringan global yang terdiri dari 38 region yang dijanjikan akan bebas emisi karbon ada tahun 2030. Jaringan global ini mencakup cloud region di Indonesia dan Singapura, dengan cloud region baru akan datang ke Malaysia dan Thailand.

Google Cloud juga menawarkan infrastruktur yang telah dioptimalkan untuk melatih dan melayani model AI generatif. Dikutip dari Techwire Asia, James Lee, General Manager, Startups & AI, menjelaskan bahwa infrastruktur ini telah dimanfaatkan oleh 70% unicorn AI generatif, seperti Anthropic, Jasper, Cohere, Replit, Runway, dan lain-lain.

Penambahan TPU, Ketersediaan Superkomputer GPU

Menjawab kebutuhan para pelanggannya ini, Google Cloud mengumumkan sejumlah peningkatan pada infrastruktur AI-nya. Pertama adalah perluasan portofolio infrastruktur dengan menghadirkan Cloud TPU v5e, yang digadang-gadang Google sebagai Cloud TPU paling efisien biaya, scalable, dan serbaguna untuk saat ini.

TPU v5e menawarkan integrasi dengan Google Kubernetes Engine (GKE), Vertex AI, dan framework seperti PyTorch, JAX, dan TensorFlow, sehingga pengguna lebih memudahkan pengguna dalam menggunakannya.

Cloud TPU v5e saat ini tersedia sebagai public preview melalui region Las Vegas dan Columbus. Ekspansi ke region-region lain akan segera dilakukan, termasuk ke region Singapura di tahun ini juga.

Google Cloud juga mengumumkan ketersediaan superkomputer A3 VM yang berbasis GPU NVIDIA H100 mulai bulan depan untuk mendukung pengembangan model-model AI berskala besar.

A3 VM mengusung prosesor ganda Intel Xeon Scalable generasi ke-4, delapan GPU NVIDIA H100 per mesin virtual, dan host memory sebesar 2TB. Berjalan di platform NVIDIA HGX H100, A3 VM menyuguhkan bisectional bandwidth sebesar 3,6TB/s di antara delapan GPT melalui teknologi NVIDIA NVLink generasi ke-4.

Di Google Cloud Next '23, Google Cloud dan NVIDIA juga mengumumkan integrasi baru untuk membantu organisasi memanfaatkan teknologi NVIDIA seperti yang digunakan oleh tim riset Google DeepMind dan Google selama dua tahun terakhir.

Inilah beberapa penyempurnaan infrastruktur yang diumumkan Google Cloud:

Google Kubernetes Engine (GKE) Enterprise: Memungkinkan skalabilitas horizontal multi-cluster yang diperlukan untuk beban kerja AI dan machine learning (ML) paling berat dan misi-kritis. Customer sekarang dapat meningkatkan produktivitas pengembangan AI dengan memanfaatkan GKE untuk mengelola beban kerja AI skala besar di Cloud TPU v5e. Selain itu, dukungan GKE untuk A3 VM dengan GPU NVIDIA H100 kini tersedia secara umum.

Penulis	:	Liana Threestayanti
Editor	:	Liana Threestayanti

Google Cloud Tingkatkan Infrastruktur AI, Bakal Tersedia di Asia Tenggara

AI

Google Cloud

Google Cloud Next

Artificial Intelligence (AI)

AI generatif

LLM

Model AI