NVIDIA Rilis Nemotron 3 Super: AI Agent Jadi 5x Lebih Cepat dan Efisien

SANTA CLARA, (11 Maret 2026)

Key Takeaway

Nemotron 3 Super menawarkan throughput hingga 5x lebih tinggi dan akurasi 2x lipat lebih baik dibandingkan generasi sebelumnya untuk aplikasi Agentic AI.
Menggunakan arsitektur hibrida Mixture-of-Experts (MoE) yang menggabungkan Mamba layers untuk efisiensi memori dan Transformer layers untuk penalaran tingkat tinggi.
Dioptimalkan khusus untuk arsitektur NVIDIA Blackwell dengan presisi NVFP4, memberikan kecepatan inferensi 4x lebih cepat dibanding seri Hopper.

Melansir laporan resmi dari NVIDIA Blog, raksasa teknologi ini baru saja meluncurkan NVIDIA Nemotron 3 Super, sebuah open model dengan 120 miliar parameter yang dirancang khusus untuk menjalankan sistem Agentic AI dalam skala besar. Model ini hadir sebagai solusi atas tantangan biaya dan kecepatan yang selama ini menghambat adopsi autonomous agents di dunia industri.

Kari Briski, selaku perwakilan NVIDIA, menyatakan bahwa model ini memiliki 12 miliar parameter aktif yang dioptimalkan untuk memproses alur kerja AI yang kompleks dengan akurasi tinggi. Kehadiran Nemotron 3 Super bertujuan mengatasi dua kendala utama dalam sistem multi-agent: context explosion (ledakan konteks) dan thinking tax (biaya komputasi penalaran).

Arsitektur Hibrida dan Optimasi Blackwell

Nemotron 3 Super menggunakan arsitektur hibrida Mixture-of-Experts (MoE) yang inovatif. Dengan mengintegrasikan Mamba layers, model ini mencapai efisiensi memori dan komputasi 4x lebih tinggi, sementara Transformer layers tetap menjaga kemampuan penalaran (reasoning) tetap tajam.

Salah satu fitur unggulannya adalah Latent MoE, sebuah teknik baru yang mampu mengaktifkan empat expert specialists dengan biaya komputasi yang setara dengan satu expert saja saat menghasilkan token berikutnya. Selain itu, fitur Multi-Token Prediction memungkinkan model memprediksi beberapa kata di masa depan secara simultan, mempercepat proses inferensi hingga 3x lipat.

Pada platform NVIDIA Blackwell, model ini beroperasi dengan presisi NVFP4. Teknologi ini secara signifikan mengurangi kebutuhan memori dan memacu kecepatan inferensi hingga 4x lebih cepat dibandingkan penggunaan presisi FP8 pada kartu grafis NVIDIA Hopper, tanpa mengurangi tingkat akurasi sedikit pun.

Solusi untuk Masalah Konteks Besar

Dalam alur kerja multi-agent, sering terjadi penggunaan token 15x lebih banyak daripada obrolan standar karena sistem harus mengirimkan ulang riwayat lengkap, hasil tool, dan penalaran perantara. Nemotron 3 Super menjawab tantangan ini dengan context window sebesar 1 juta token.

Kapasitas memori yang masif ini memungkinkan AI Agent untuk mempertahankan seluruh status alur kerja dalam memori, sehingga mencegah terjadinya goal drift—kondisi di mana AI kehilangan fokus pada tujuan asli karena tumpukan informasi yang terlalu panjang.

Dampak bagi Indonesia

Peluncuran Nemotron 3 Super memiliki implikasi signifikan bagi ekosistem teknologi di Indonesia, terutama dalam mengakselerasi transformasi digital di berbagai sektor:

Efisiensi Data Center Lokal: Perusahaan penyedia Data Center di Indonesia yang mulai mengadopsi GPU NVIDIA Blackwell dapat menawarkan layanan komputasi yang jauh lebih hemat biaya bagi startup lokal yang mengembangkan solusi Generative AI.
Sektor Fintech dan Perbankan: Dengan kemampuan memproses ribuan halaman laporan keuangan dalam satu jendela konteks, institusi finansial di Indonesia dapat mengotomatisasi analisis risiko dan deteksi penipuan (fraud detection) dengan lebih cepat dan akurat, mengurangi biaya operasional per transaksi.
Pengembangan Local AI: Sifatnya yang open weights memberikan peluang bagi pengembang lokal untuk melakukan fine-tuning model ini menggunakan dataset Bahasa Indonesia tanpa harus membangun infrastruktur dari nol. Hal ini berpotensi menurunkan hambatan masuk bagi inovasi Cybersecurity dan layanan publik berbasis AI di tanah air.
Adopsi di Sektor Telekomunikasi: Operator seluler besar di Indonesia dapat memanfaatkan model ini untuk otomatisasi jaringan dan layanan pelanggan tingkat lanjut yang lebih responsif dan cerdas.

Saat ini, Nemotron 3 Super sudah dapat diakses melalui berbagai platform seperti Hugging Face, Perplexity, dan NVIDIA NIM, serta segera tersedia di layanan Cloud Computing global seperti Google Cloud, AWS, dan Azure.

Artikel ini akan diperbarui seiring tersedianya informasi baru. Join Komunitas Rekayasa AI di Discord untuk diskusi lebih lanjut.

NVIDIA Rilis Nemotron 3 Super: AI Agent Jadi 5x Lebih Cepat dan Efisien

NVIDIA Rilis Nemotron 3 Super: AI Agent Jadi 5x Lebih Cepat dan Efisien

Arsitektur Hibrida dan Optimasi Blackwell

Solusi untuk Masalah Konteks Besar

Dampak bagi Indonesia

Tim Rekayasa AI

Artikel Terkait

Biaya AI Membengkak: Industri Berjuang Kendalikan Pengeluaran 'Token' yang Merajalela

AirTrunk Gelontorkan $30 Miliar Bangun 5GW Data Center AI di India

Google Bayar SpaceX US$920 Juta Per Bulan demi Perkuat Infrastruktur AI