Ad space available
Arena: Mahasiswa PhD UC Berkeley Jadi 'Hakim' AI Dunia Bermahar Rp26 T
Arena bertransformasi dari proyek riset menjadi benchmark LLM standar industri dengan valuasi $1,7 miliar. Simak bagaimana startup ini menjaga netralitas dan mempersiapkan era AI Agent.

Arena: Mahasiswa PhD UC Berkeley Jadi 'Hakim' AI Dunia Bermahar Rp26 T
SAN FRANCISCO, (18 Maret 2026)
- Arena (sebelumnya LM Arena) kini menjadi benchmark de facto untuk LLM dengan valuasi $1,7 miliar hanya dalam waktu 7 bulan sejak peluncuran produk.
- Pendirinya menjaga netralitas melalui evaluasi dinamis oleh manusia yang jauh lebih sulit dimanipulasi dibandingkan pengujian statis tradisional.
- Fokus pengujian Arena kini bergeser dari sekadar chatbot menuju AI Agent yang mampu menangani tugas spesifik seperti medis, hukum, dan pemrograman.
Melansir laporan dari TechCrunch, dua mahasiswa PhD asal UC Berkeley, Anastasios Angelopoulos dan Wei-Lin Chiang, telah mengubah proyek riset akademik mereka menjadi institusi paling berpengaruh di industri kecerdasan buatan global. Perusahaan mereka, Arena (sebelumnya dikenal sebagai LM Arena), kini menjadi pusat perhatian sebagai penyedia leaderboard utama bagi pengembang LLM di seluruh dunia.
Dalam wawancara terbaru di podcast Equity, para pendiri menjelaskan bahwa Arena telah berevolusi menjadi instrumen yang menentukan siklus pendanaan, strategi peluncuran produk, hingga narasi PR bagi perusahaan teknologi raksasa. Dengan valuasi yang kini mencapai $1,7 miliar (sekitar Rp26,6 triliun), Arena membuktikan bahwa standardisasi pengujian Generative AI adalah sektor yang sangat krusial di tengah membanjirnya model-model baru di pasar.
Salah satu tantangan terbesar yang dihadapi Arena adalah menjaga objektivitas. Meskipun mereka menerima pendanaan dari pemain besar yang juga mereka nilai—seperti OpenAI, Google, dan Anthropic—para pendiri menekankan konsep "structural neutrality". Mereka mengklaim bahwa sistem benchmark mereka tidak dapat dimanipulasi layaknya pengujian statis karena menggunakan metode crowdsourced human evaluation secara blind test.
Data terbaru dari Arena menunjukkan dinamika persaingan yang menarik, di mana model Claude milik Anthropic saat ini memimpin leaderboard khusus untuk kategori ahli (expert) dalam kasus penggunaan medis dan hukum. Ke depannya, Arena berencana melampaui sekadar interaksi chat dengan meluncurkan produk enterprise yang berfokus pada pengujian AI Agent untuk tugas-tugas kompleks dan coding di dunia nyata.
Dampak bagi Indonesia
Munculnya standar global seperti Arena memiliki implikasi signifikan bagi ekosistem teknologi di Indonesia:
- Standar Startup Lokal: Pengembang AI di Indonesia kini memiliki acuan yang lebih kredibel untuk memilih LLM mana yang paling efisien untuk aplikasi mereka, mulai dari layanan pelanggan hingga analisis data korporasi, dengan konversi biaya operasional yang lebih terukur.
- Transparansi Teknologi: Dengan valuasi mencapai Rp26,6 triliun, kesuksesan Arena menekankan pentingnya transparansi. Hal ini dapat mendorong regulator di Indonesia untuk menuntut akuntabilitas lebih tinggi dari penyedia teknologi AI asing yang beroperasi di pasar domestik agar tidak memberikan klaim performa yang berlebihan.
- Adopsi AI Agent: Pergeseran fokus Arena ke AI Agent akan mempercepat adopsi teknologi otomatisasi di sektor korporasi Indonesia. Perusahaan lokal dapat mulai mengintegrasikan AI Agent yang sudah teruji untuk tugas-tugas spesifik seperti pemrograman dan riset hukum, yang berpotensi meningkatkan produktivitas tenaga kerja ahli di dalam negeri.
Artikel ini akan diperbarui seiring tersedianya informasi baru. Join Komunitas Rekayasa AI di Discord untuk diskusi lebih lanjut.
Ad space available
Ditulis oleh
Tim Rekayasa AI
Kontributor Rekayasa AI yang passionate tentang teknologi AI dan dampaknya di Indonesia.


