Peneliti MIT Ajarkan Model AI Katakan 'Tidak Tahu' untuk Atasi Halusinasi

CAMBRIDGE, (22 April 2026)

Key Takeaway

Teknik RLCR (Reinforcement Learning with Calibration Rewards) melatih AI untuk memproduksi estimasi kepercayaan (confidence scores) yang selaras dengan akurasi aslinya.
Metode ini menggunakan Brier score untuk menghukum model yang memberikan jawaban salah dengan tingkat keyakinan tinggi, sekaligus menghargai jawaban benar yang disertai alasan kuat.
Dalam uji coba, RLCR berhasil mengurangi kesalahan kalibrasi hingga 90% pada berbagai benchmark penalaran dan matematika.

Kepercayaan diri yang tinggi sering kali bersifat persuasif, namun dalam sistem Artificial Intelligence, hal tersebut sering kali menyesatkan. Mengutip laporan dari MIT News, para peneliti di Computer Science and Artificial Intelligence Laboratory (CSAIL) MIT telah menemukan solusi untuk mengatasi masalah over-konfidensi pada model AI yang menjadi akar penyebab hallucination.

Melansir data dari Rachel Gordon (MIT CSAIL), model penalaran paling canggih saat ini memiliki sifat yang mirip dengan individu bersuara paling keras dalam sebuah ruangan: mereka menyampaikan setiap jawaban dengan kepastian yang tak tergoyahkan, baik saat mereka benar maupun saat hanya menebak.

Masalah pada Reinforcement Learning Tradisional

Masalah ini berakar pada metode Reinforcement Learning (RL) yang digunakan untuk melatih model seperti OpenAI o1. Sistem RL tradisional memberikan reward (imbalan) hanya jika model menjawab dengan benar, dan memberikan penalti jika salah. Model yang mencapai jawaban benar melalui penalaran hati-hati menerima imbalan yang sama dengan model yang hanya menebak secara beruntung.

"Metode pelatihan standar memang sederhana dan kuat, tetapi tidak memberikan insentif bagi model untuk mengekspresikan ketidakpastian atau mengatakan 'saya tidak tahu'," ujar Mehul Damani, mahasiswa doktoral MIT dan penulis utama studi tersebut.

Inovasi RLCR dan Brier Score

Teknik baru yang disebut RLCR (Reinforcement Learning with Calibration Rewards) mengatasi hal ini dengan menambahkan parameter Brier score ke dalam fungsi imbalan. Ini adalah metrik yang menghitung selisih antara tingkat kepercayaan yang dinyatakan model dengan akurasi aktualnya.

Melalui RLCR, model belajar untuk melakukan penalaran (reasoning) terhadap masalah sekaligus ketidakpastiannya sendiri. Hasilnya, jawaban salah yang diberikan dengan keyakinan tinggi akan dihukum berat, sementara jawaban benar yang disertai keragu-raguan yang tidak perlu juga akan dikurangi imbalannya.

Dalam eksperimen pada model dengan 7 miliar parameter, RLCR secara konsisten mengungguli pendekatan RL biasa. Menariknya, pelatihan RL standar justru terbukti memperburuk kalibrasi model seiring meningkatnya kemampuan penalaran, sedangkan RLCR berhasil memperbaiki keduanya secara simultan.

Dampak bagi Indonesia

Implementasi teknologi kalibrasi AI ini memiliki dampak signifikan bagi ekosistem digital di Indonesia:

Sektor Kesehatan dan Hukum: Penggunaan Generative AI untuk konsultasi medis atau bantuan hukum di Indonesia sering terhambat risiko misinformasi. Dengan model yang bisa berkata "saya tidak yakin", risiko malapraktik akibat saran AI dapat ditekan secara drastis.
Fintech dan Perbankan: Dalam sistem penilaian kredit (credit scoring) berbasis AI di Indonesia, estimasi kepercayaan yang akurat sangat krusial untuk manajemen risiko perbankan nasional.
Edukasi dan Literasi Digital: Mengingat tingginya penggunaan AI di kalangan pelajar Indonesia, model yang jujur tentang batas kemampuannya akan membantu pengguna membangun sikap kritis dan tidak menelan mentah-mentah output dari AI.
Efisiensi Infrastruktur: Teknik RLCR terbukti efektif pada model berskala menengah (7B parameter), yang berarti perusahaan teknologi lokal di Indonesia dapat mengimplementasikannya tanpa memerlukan infrastruktur Data Center raksasa.

--- Artikel ini akan diperbarui seiring tersedianya informasi baru. Join Komunitas Rekayasa AI di Discord untuk diskusi lebih lanjut.

Peneliti MIT Ajarkan Model AI Katakan 'Tidak Tahu' untuk Atasi Halusinasi

Peneliti MIT Ajarkan Model AI Katakan 'Tidak Tahu' untuk Atasi Halusinasi

Masalah pada Reinforcement Learning Tradisional

Inovasi RLCR dan Brier Score

Dampak bagi Indonesia

Tim Rekayasa AI

Artikel Terkait

Biaya AI Membengkak: Industri Berjuang Kendalikan Pengeluaran 'Token' yang Merajalela

AirTrunk Gelontorkan $30 Miliar Bangun 5GW Data Center AI di India

Google Bayar SpaceX US$920 Juta Per Bulan demi Perkuat Infrastruktur AI