Biaya AI Membengkak: Industri Berjuang Kendalikan Pengeluaran 'Token' yang Merajalela

JAKARTA, (6 Juni 2026)

Key Takeaway

Pengeluaran untuk AI melonjak drastis, dengan perusahaan seperti Uber dan Microsoft membatasi anggaran AI mereka lebih awal dari perkiraan.
Munculnya pasar baru dan badan standar seperti Tokenomics Foundation dari Linux Foundation, bertujuan untuk menyediakan alat dan kerangka kerja untuk melacak serta mengelola biaya AI, mirip dengan FinOps untuk Cloud Computing.
Meskipun adopsi AI dan penggunaan AI Agent meningkatkan produktivitas, ROI dari pengeluaran besar masih belum jelas, menyoroti kebutuhan akan metrik dan akuntabilitas biaya yang lebih baik.

Mengutip laporan dari TechCrunch, perusahaan-perusahaan di seluruh industri kini mulai keberatan dengan biaya AI. Uber menghabiskan seluruh anggaran AI coding tahun 2026 mereka pada bulan April. Microsoft mencabut lisensi Claude Code pengembang mereka beberapa bulan setelah mengaktifkannya. Seorang karyawan Priceline juga mengungkapkan kepada TechCrunch bahwa perpanjangan kontrak Cursor rutin kembali dengan biaya 4-5 kali lebih mahal.

Meskipun harga per-"token" telah menurun, dorongan untuk adopsi AI yang lebih luas dan penggunaan AI Agent yang semakin otonom telah mendorong konsumsi "token" melonjak lebih tinggi. Perusahaan yang "memanjakan diri" pada awal 2025 dengan langganan tak terbatas kini berebut untuk memahami ke mana uang mereka mengalir, menarik kembali pengeluaran, dan mencari tahu apakah mereka dapat menyelamatkan sebagian ROI dari anggaran yang membengkak.

Sementara itu, sebuah pasar baru sedang terbentuk untuk memenuhi kebutuhan ini. Startup, vendor mapan, dan badan standar baru semuanya berlomba untuk menyediakan perusahaan alat dan bahasa untuk melacak pengeluaran mereka.

"Enam bulan lalu, saya akan berbicara dengan pelanggan dan semuanya akan tentang 'Apa yang bisa dilakukannya? Apakah cukup baik?'" kata Alexander Embiricos, Head of Enterprise OpenAI, kepada TechCrunch di sebuah acara di New York City minggu ini. "Percakapan kami tidak pernah tentang itu lagi sekarang. Sekarang percakapan tentang, 'Hei, kami menghabiskan begitu banyak. Visibilitas apa yang Anda miliki? Auditabilitas apa yang Anda miliki? Kontrol 'token' apa yang Anda miliki? Berapa efisiensi model Anda?'"

Dengan latar belakang inilah, Linux Foundation minggu ini meluncurkan rencana untuk Tokenomics Foundation, sebuah badan standar baru yang bertujuan untuk menanamkan disiplin biaya yang sama di sekitar "token" AI seperti yang dilakukan FinOps untuk Cloud Spend.

"Pada bulan April dan Mei, saya mulai mendengar dari perusahaan: 'Ya Tuhan, kami sudah 3 kali lipat dari seluruh anggaran 'token' 2026 kami padahal baru bulan April,'" kata J.R. Storment, Executive Director FinOps Foundation, sebuah proyek di bawah Linux Foundation, kepada TechCrunch. "Kami mulai mendengar krisis eksistensial, dan seluruh percakapan bergeser dari tokenmaxxing dan 'go fast' menjadi 'kami butuh 'guardrails', bagaimana kami mengontrol ini?'"

Seruan yang terdengar di seluruh dunia teknologi ini menyusul tuntutan sengit dari para CEO yang mendorong tim mereka untuk menggunakan model terbaik dan bergerak cepat, tanpa memedulikan biaya. Model-model baru yang dirilis pada bulan November seperti Anthropic’s Claude Opus 4.5, OpenAI’s GPT-5.1, dan Google’s Gemini 3 Pro membawa peningkatan signifikan pada AI Agent tools, yang telah melipatgandakan konsumsi. Beginilah cara sebuah perusahaan dilaporkan mendapati tagihan Claude mereka mencapai $500 juta setelah lupa menetapkan batas penggunaan untuk karyawan.

"Ini seperti epidemi kokain," kata Chris Reed, Senior Director of IT Finance di Priceline, mencatat bahwa perusahaan telah mulai menetapkan batas "token" pada kelompok-kelompok tertentu. "Mereka membiarkan Anda mencobanya untuk membuat Anda ketagihan, dan sekarang Anda seperti terikat padanya."

Vitaly Gordon, CEO platform engineering operations Faros AI, mengatakan ia baru-baru ini berbicara dengan seorang CTO yang mengatakan kepadanya: "Salah satu engineer saya menghabiskan $40.000 untuk 'token' bulan lalu, dan saya benar-benar tidak tahu apakah saya harus menghentikannya atau saya harus pergi dan memberi tahu orang lain untuk menjadi seperti dia."

Sebuah studi dua tahun terhadap 20.000 developer yang dirilis Faros pada bulan April menemukan bahwa output meningkat, tetapi begitu pula bug dan penulisan ulang. Jellyfish, sebuah platform engineering management, juga menemukan engineer yang paling banyak menggunakan "token" sekitar dua kali lebih produktif daripada mereka yang lebih sedikit menggunakan AI, tetapi mereka menghabiskan 10 kali jumlah "token" untuk mencapai hal tersebut.

Nicholas Arcolano, Head of Research di Jellyfish, mengatakan kepada TechCrunch melalui email bahwa pengeluaran untuk AI meledak sebagian besar karena fitur "agentic", dengan konsumsi per-developer meningkat sekitar 18,6 kali dalam sembilan bulan. Secara keseluruhan, statistik ini membuat argumen produktivitas lebih keruh daripada yang disarankan oleh pengeluaran.

"Apakah pengeluaran ekstrem membuahkan hasil, bergantung pada nilai bisnis akhir dari kode yang dikirim (misalnya pendapatan), yang sebagian besar perusahaan masih belum bisa mengukurnya," kata Arcolano.

Setidaknya sebagian dari masalah pengukuran itu adalah skala besar penggunaan AI saat ini.

"Melacak biaya Cloud adalah masalah data ratusan juta baris per bulan," kata J.R. Storment. "Melacak biaya 'token' adalah masalah data triliunan baris per bulan. Anda tidak bisa begitu saja memasukkannya ke spreadsheet atau bahkan alat dasar. Anda harus memikirkan kembali secara fundamental tooling, spesifikasi, dan sistem akuntansi Anda untuk melakukan itu."

Di Priceline, Reed sudah melihat adanya ketidaksesuaian. Ia mencatat masalah antara penggunaan yang dilaporkan vendor dan data internal Priceline.

"Saya memulai karir saya di manajemen pengeluaran telekomunikasi, dan saya melihat semua paralel yang sama, dari telekomunikasi ke Cloud hingga AI," katanya. "Kapan pun Anda memperkenalkan sesuatu yang baru, itu sangat rentan terhadap kesalahan penagihan, audit, dan peluang optimasi."

Sebuah pasar mulai terbentuk di sekitar masalah ini. Ada perusahaan "pure-play", seperti Pay-i, yang melacak, mengukur, dan mengoptimalkan biaya serta kinerja investasi GenAI. Paid, sementara itu, memungkinkan developer melacak biaya, mengukur penggunaan, dan menagih pengguna berdasarkan nilai sebenarnya daripada biaya langganan.

Kemudian ada perusahaan seperti Jellyfish, Waydev, dan Faros AI, yang semuanya menyediakan AI Agent monitoring untuk membuktikan ROI dari developer tools. Storment mengatakan sebagian besar dari 180 vendor di FinOps Foundation condong ke ruang ini.

Perusahaan dengan distribusi yang sudah ada juga menambahkan fitur-fitur baru untuk memanfaatkan pasar baru ini. Ramp baru-baru ini bergerak ke AI spend management; Datadog dan New Relic telah menambahkan layanan seperti Cloud Cost Management, "token-level observability", dan GPU monitoring. Pada konferensi FinOps X minggu depan, AWS diharapkan memperkenalkan fitur manajemen keuangan baru yang ditujukan untuk pengeluaran AI enterprise.

Tiffany Luck, seorang Partner di NEA, berpendapat bahwa efisiensi "token" dan "observability" kemungkinan akan ditambahkan pada "harness atau app layer." Dia menunjuk pada Factory, sebuah startup yang membuat AI Agent untuk enterprise, yang minggu ini meluncurkan sebuah model router yang secara otomatis memilih model yang tepat untuk setiap tugas.

Vitaly Gordon memperkirakan laboratorium "frontier" dan penyedia model lainnya akan mengadopsi optimasi bergaya OpenRouter untuk mengarahkan permintaan ke model termurah — sebuah tren yang sudah muncul pada tagihan Claude enterprise.

"Laporan keuangan untuk berapa banyak yang Anda habiskan untuk Anthropic, bahkan jika Anda memanggil model Opus, beberapa pengeluaran akan ada pada Sonnet atau Haiku, karena mereka cukup pintar untuk melakukannya," kata Gordon. "Saya pikir ini akan menjadi hal yang semakin umum."

Namun, semua alat ini dibangun tanpa bahasa umum atau definisi bersama tentang berapa biaya "token", apa yang dihasilkannya, dan bagaimana membandingkan pengeluaran antar vendor. Di sinilah Tokenomics Foundation berharap dapat terbukti bermanfaat.

Foundation ini sedang membangun definisi kanonik dan kerangka kerja untuk "tokenomics"; standar terbuka, spesifikasi, dan metrik untuk penggunaan dan penagihan "token" AI; serta metrik baru untuk ekonomi AI, seperti "cost-per-intelligence" atau "tokens-per-watt". Ini juga berencana untuk mendefinisikan metrik di seluruh efektivitas "token factory" dan efisiensi konsumsi. Grup ini merencanakan peluncuran resmi pada bulan Juli, dan akan mengumumkan lebih banyak anggota pada konferensi FinOps X minggu depan.

"Ekonomi 'token' secara fundamental lebih abstrak dan buram daripada apa pun yang pernah kami kelola pada skala ini sebelumnya," kata Nishant Gupta, Chief Availability Officer di Salesforce, dalam sebuah pernyataan. "Ini membutuhkan otot operasional yang berbeda dari yang dibangun industri untuk Cloud."

Namun, Goldman Sachs memproyeksikan penggunaan "token" global akan meningkat 24 kali lipat pada tahun 2030. Perusahaan yang sudah melampaui anggaran membutuhkan solusi sekarang, dan deliverable pertama yayasan tersebut masih beberapa bulan lagi.

"Mungkin kita menciptakan mesin uap, tetapi kita masih belum menemukan 'assembly line'," kata Gordon.

Menurut Arcolano, langkah cerdas adalah adopsi yang luas dan moderat.

"ROI terbaik berasal dari memindahkan sebagian besar pengguna dari penggunaan rendah ke sedang, bukan mendorong pengguna berat menjadi lebih tinggi," katanya.

Dampak bagi Indonesia

Fenomena pembengkakan biaya AI ini juga berpotensi memberikan dampak signifikan bagi ekosistem teknologi di Indonesia. Meskipun belum banyak laporan spesifik mengenai perusahaan Indonesia yang mengalami krisis biaya "token" seperti di Barat, tren adopsi Generative AI dan AI Agent di kalangan startup maupun enterprise lokal terus meningkat.

Bagi perusahaan rintisan (startup) dan UMKM yang sedang mengeksplorasi penggunaan AI, volatilitas dan ketidakjelasan biaya "token" dapat menjadi hambatan serius. Mereka mungkin akan lebih cenderung memilih solusi AI open-source atau model lokal yang lebih efisien dan transparan dalam struktur biayanya, dibandingkan LLM global yang mahal. Hal ini bisa mendorong inovasi dalam pengembangan model AI yang lebih hemat biaya di Indonesia.

Di sisi lain, perusahaan enterprise besar di Indonesia yang telah mengintegrasikan AI secara mendalam perlu segera mengembangkan strategi FinOps khusus untuk AI mereka. Permintaan akan talent di bidang Prompt Engineering dan AI Engineering yang juga memiliki keahlian dalam optimasi biaya akan meningkat. Selain itu, munculnya layanan manajemen biaya AI dari vendor lokal atau integrasi fitur serupa pada platform Cloud Computing di Indonesia dapat menjadi peluang pasar baru. Pemerintah atau asosiasi industri juga dapat memainkan peran dalam mempromosikan standar dan praktik terbaik untuk pengelolaan biaya AI yang bertanggung jawab, guna memastikan adopsi AI yang berkelanjutan dan memberikan ROI yang jelas di pasar Indonesia.

Artikel ini akan diperbarui seiring tersedianya informasi baru. Join Komunitas Rekayasa AI di Discord untuk diskusi lebih lanjut.

Biaya AI Membengkak: Industri Berjuang Kendalikan Pengeluaran 'Token' yang Merajalela

Dampak bagi Indonesia

Tim Rekayasa AI

Artikel Terkait

AirTrunk Gelontorkan $30 Miliar Bangun 5GW Data Center AI di India

Google Bayar SpaceX US$920 Juta Per Bulan demi Perkuat Infrastruktur AI

Para CEO Tech Alami 'AI Psychosis'? Aaron Levie: PHK Massal Jadi Indikasi