Advertisement

Ad space available

Berita AI

OpenAI Luncurkan Fitur Voice Intelligence Baru di API: Ada GPT-5 Reasoning

OpenAI memperkenalkan rangkaian fitur kecerdasan suara baru pada API miliknya yang didukung kemampuan penalaran setara GPT-5. Pembaruan ini mencakup fitur terjemahan real-time dan transkripsi langsung untuk berbagai sektor industri.

Tim Rekayasa AI
Penulis
7 Mei 2026
4 min read
#OpenAI#API#GPT-5#Voice Intelligence#Artificial Intelligence
OpenAI Luncurkan Fitur Voice Intelligence Baru di API: Ada GPT-5 Reasoning

OpenAI Luncurkan Fitur Voice Intelligence Baru di API: Dukung Kemampuan Terjemahan dan Transkripsi Real-time

SAN FRANCISCO, (7 Mei 2026)

Key Takeaway
  • OpenAI merilis GPT-Realtime-2 dengan GPT-5-class reasoning untuk menangani permintaan suara yang kompleks dan simulasi vokal yang realistis.
  • Fitur baru mencakup GPT-Realtime-Translate yang mendukung lebih dari 70 bahasa input serta GPT-Realtime-Whisper untuk transkripsi live speech-to-text.
  • Sistem keamanan kini dilengkapi guardrails otomatis untuk menghentikan percakapan yang terdeteksi melanggar panduan konten berbahaya atau penipuan.

Mengutip laporan dari TechCrunch, OpenAI mengumumkan pada hari Kamis bahwa API mereka kini mencakup sejumlah fitur Voice Intelligence baru. Pembaruan ini dirancang khusus untuk membantu para pengembang membangun aplikasi yang mampu berbicara, mentranskripsi, hingga menerjemahkan percakapan pengguna secara instan.

Melansir data resmi perusahaan, model terbaru bertajuk GPT-Realtime-2 hadir sebagai simulasi vokal realistis yang mampu berinteraksi dengan pengguna. Berbeda dari pendahulunya (GPT-Realtime-1.5), model ini dibangun dengan GPT-5-class reasoning. OpenAI mengeklaim bahwa peningkatan kemampuan penalaran ini ditujukan untuk menangani permintaan pengguna yang jauh lebih rumit dan membutuhkan konteks mendalam.

Terjemahan dan Transkripsi dalam Sekejap

Selain model utama, OpenAI juga meluncurkan GPT-Realtime-Translate. Sesuai namanya, fitur ini menyediakan layanan terjemahan real-time yang mampu mengikuti kecepatan bicara pengguna secara natural. Fitur ini mencakup lebih dari 70 bahasa input (bahasa yang dipahami sistem) dan 13 bahasa output (bahasa yang dihasilkan oleh sistem).

Melengkapi ekosistem tersebut, hadir pula kemampuan transkripsi baru melalui GPT-Realtime-Whisper. Fitur ini memberikan kemampuan live speech-to-text yang menangkap interaksi tepat saat percakapan berlangsung.

"Secara kolektif, model yang kami luncurkan memindahkan audio real-time dari sekadar call-and-response sederhana menuju voice interface yang benar-benar bisa bekerja: mendengarkan, bernalar, menerjemahkan, mentranskripsi, dan mengambil tindakan saat percakapan berlangsung," ungkap pihak OpenAI.

Keamanan dan Penyalahgunaan

Mengingat potensi penyalahgunaan teknologi suara untuk penipuan (fraud) atau spam, OpenAI menegaskan telah menyematkan guardrails yang ketat. Pemicu tertentu telah ditanamkan dalam sistem sehingga percakapan dapat dihentikan secara otomatis jika terdeteksi melanggar panduan konten berbahaya perusahaan.

Seluruh model suara baru ini sudah tersedia dalam Realtime API milik OpenAI. Untuk skema biaya, fitur Translate dan Whisper akan ditagih berdasarkan durasi per menit, sementara GPT-Realtime-2 akan menggunakan perhitungan konsumsi Token.

Dampak bagi Indonesia

Kehadiran fitur Voice Intelligence dengan GPT-5-class reasoning ini membawa dampak signifikan bagi ekosistem teknologi di Indonesia:

  1. Transformasi Customer Service: Perusahaan rintisan (startup) dan korporasi besar di Indonesia dapat mengintegrasikan API ini untuk menciptakan AI Agent layanan pelanggan yang mampu berbahasa Indonesia dengan intonasi yang jauh lebih manusiawi dan solutif.
  2. Aksesibilitas Bahasa: Dengan dukungan lebih dari 70 bahasa input, pengembang lokal dapat membangun alat penerjemah instan untuk dialek daerah ke bahasa asing atau sebaliknya, yang sangat berguna bagi sektor pariwisata.
  3. Estimasi Biaya Operasional: Bagi pengembang di Indonesia, penggunaan API ini akan bergantung pada kurs IDR terhadap USD. Jika diasumsikan biaya layanan real-time suara di pasar global berkisar antara $0.05 hingga $0.10 per menit, maka perusahaan lokal perlu mengalokasikan anggaran sekitar Rp800 hingga Rp1.600 per menit untuk operasional voice AI mereka.
  4. Keamanan Siber: Fitur guardrails dari OpenAI sangat krusial bagi pasar Indonesia untuk meminimalisir maraknya kasus penipuan berbasis telepon (vishing) yang menggunakan teknologi kloning suara.

Artikel ini akan diperbarui seiring tersedianya informasi baru. Join Komunitas Rekayasa AI di Discord untuk diskusi lebih lanjut.

Advertisement

Ad space available

✍️

Ditulis oleh

Tim Rekayasa AI

Kontributor Rekayasa AI yang passionate tentang teknologi AI dan dampaknya di Indonesia.

Bagikan:𝕏fin