Dekonstruksi Monopoli Silikon: Analisis Arsitektur, Ekonomi Inferensi, dan Batasan Termodinamika NVIDIA GTC 2026

30 Maret 2026

NVIDIA bergeser dari fokus pelatihan model ke era 'inferensi agen' dengan proyeksi permintaan infrastruktur AI mencapai $1 triliun pada 2027.

key_point

GPU Rubin R100 membawa 336 miliar transistor dan bandwidth memori 22 TB/s untuk menangani beban kerja agen AI yang intensif.

336 Miliar Transistor, 22 TB/s Bandwidth Memori, 50 PetaFLOPS FP4

statistic

Satu rak NVL72 mengintegrasikan 72 GPU Rubin, memberikan kinerja inferensi 3,6 ExaFLOPS dengan efisiensi biaya 10x lebih murah.

72 GPU per rak, 3.600 PetaFLOPS (3,6 ExaFLOPS), 20,7 TB HBM4

graph

NVIDIA mengakuisisi aset Groq untuk mengintegrasikan teknologi LPU guna menekan latensi inferensi yang tidak bisa dicapai GPU konvensional.

key_point

Arsitektur masa depan Rubin Ultra memerlukan daya 600 kW per rak, memicu tantangan infrastruktur listrik yang sangat berat.

600.000 Watt per rak, 100 GW kapasitas pusat data

conclusion