OpenAI Rombak Infrastruktur WebRTC demi Voice AI Super Cepat dan Scalable

[SAN FRANCISCO], (4 Mei 2026)

Key Takeaway

OpenAI mengadopsi arsitektur split relay plus transceiver untuk memisahkan perutean paket dari terminasi protokol WebRTC, meningkatkan efisiensi di ekosistem Kubernetes.
Penggunaan ufrag (ICE username fragment) memungkinkan perutean paket pertama secara deterministik tanpa lookup eksternal yang memperlambat koneksi.
Infrastruktur ini dirancang untuk melayani lebih dari 900 juta pengguna mingguan dengan latensi rendah dan stabilitas tinggi di skala global.

Mengutip laporan teknis terbaru dari OpenAI, perusahaan pengembang ChatGPT ini baru saja merombak total stack WebRTC mereka. Langkah ini diambil untuk menghadirkan pengalaman Voice AI yang lebih natural, di mana percakapan dapat mengalir secepat kecepatan bicara manusia tanpa jeda yang canggung atau interupsi yang terpotong.

Melansir data internal OpenAI, tantangan utama dalam menghadirkan Voice AI pada skala 900 juta pengguna aktif mingguan adalah menjaga latensi tetap rendah di tengah kondisi jaringan yang bervariasi. Untuk itu, tim teknis OpenAI yang dipandu oleh pakar industri seperti Justin Uberti dan Sean DuBois, membangun arsitektur khusus yang memisahkan peran relay dan transceiver.

Mengapa Memilih WebRTC?

WebRTC adalah standar terbuka untuk pengiriman audio, video, dan data dengan latensi rendah. Bagi OpenAI, WebRTC memberikan fondasi yang kuat karena menangani bagian tersulit dari media interaktif: ICE untuk konektivitas melalui NAT, enkripsi DTLS dan SRTP, serta negosiasi codec.

Dengan WebRTC, AI Agent dapat mulai melakukan transkripsi, penalaran (reasoning), hingga pemanggilan alat (tool use) saat pengguna masih berbicara. Ini menciptakan perbedaan besar antara sistem yang terasa seperti percakapan sungguhan dibandingkan sistem push-to-talk yang kaku.

Arsitektur Baru: Relay + Transceiver

OpenAI memilih model transceiver dibandingkan SFU (Selective Forwarding Unit) tradisional. Dalam model ini, layanan edge WebRTC menghentikan (terminate) koneksi klien dan mengubah media menjadi protokol internal yang lebih sederhana untuk diproses oleh inference backend.

Masalah muncul ketika arsitektur ini dijalankan di atas Kubernetes. Model satu-port-per-sesi konvensional tidak cocok dengan Cloud Load Balancer karena membutuhkan rentang port UDP publik yang sangat besar dan sulit diamankan. Solusi OpenAI adalah:

Relay: Lapisan penerusan UDP ringan yang hanya membaca metadata paket untuk menentukan tujuan tanpa melakukan dekripsi.
Transceiver: Endpoint WebRTC yang memegang status sesi, melakukan jabat tangan DTLS, dan dekripsi SRTP.

Untuk merutekan paket pertama secara cepat, OpenAI menyematkan petunjuk rute ke dalam ufrag (ICE username fragment). Dengan cara ini, Global Relay dapat langsung mengetahui ke cluster mana paket harus dikirimkan tanpa perlu melakukan pengecekan ke database eksternal yang memakan waktu.

Optimasi Performa dengan Go dan Linux

Layanan relay ini ditulis menggunakan bahasa pemrograman Go. Untuk mencapai efisiensi maksimal, OpenAI memanfaatkan opsi soket Linux SO_REUSEPORT agar beberapa worker dapat menggunakan port UDP yang sama, serta runtime.LockOSThread untuk menjaga lokalitas cache pada CPU core.

Dampak bagi Indonesia

Implementasi infrastruktur global ini membawa dampak signifikan bagi ekosistem teknologi di Indonesia:

Peningkatan User Experience: Pengguna ChatGPT Voice di Indonesia, yang sering terkendala latensi internasional, akan merasakan respons AI yang jauh lebih cepat. Melalui Global Relay, paket data suara akan masuk lewat titik akses (Point of Presence) terdekat sebelum melewati backbone OpenAI.
Adopsi Developer Lokal: Pengembang di Indonesia yang membangun aplikasi menggunakan Realtime API (seperti layanan pelanggan otomatis) kini dapat menawarkan solusi yang lebih reliabel tanpa khawatir akan masalah jitter atau packet loss yang sering terjadi di jaringan seluler lokal.
Efisiensi Biaya: Dengan performa yang lebih stabil, perusahaan lokal dapat mengurangi kegagalan sesi AI yang membuang kuota token API. Jika dikonversi ke kurs saat ini (asumsi Rp16.000/USD), efisiensi infrastruktur ini memungkinkan pengembang mengoptimalkan biaya operasional LLM dan Generative AI mereka.

Artikel ini akan diperbarui seiring tersedianya informasi baru. Join Komunitas Rekayasa AI di Discord untuk diskusi lebih lanjut.

OpenAI Rombak Infrastruktur WebRTC demi Voice AI Super Cepat dan Scalable

OpenAI Rombak Infrastruktur WebRTC demi Voice AI Super Cepat dan Scalable

Mengapa Memilih WebRTC?

Arsitektur Baru: Relay + Transceiver

Optimasi Performa dengan Go dan Linux

Dampak bagi Indonesia

Tim Rekayasa AI

Artikel Terkait

Biaya AI Membengkak: Industri Berjuang Kendalikan Pengeluaran 'Token' yang Merajalela

AirTrunk Gelontorkan $30 Miliar Bangun 5GW Data Center AI di India

Google Bayar SpaceX US$920 Juta Per Bulan demi Perkuat Infrastruktur AI