Studi Harvard: AI o1 Ungguli Akurasi Diagnosis Dokter Gawat Darurat

CAMBRIDGE, (3 Mei 2026)

Key Takeaway

Model OpenAI o1 mencatat akurasi diagnosis sebesar 67% dalam kasus gawat darurat, mengungguli dokter spesialis manusia yang berada di kisaran 50-55%.
AI menunjukkan performa paling superior pada tahap triage awal, di mana informasi pasien sangat terbatas namun keputusan harus diambil dengan cepat.
Peneliti menekankan perlunya uji klinis lanjutan dan kerangka akuntabilitas sebelum AI dapat diimplementasikan dalam keputusan medis hidup-mati.

Melansir laporan dari TechCrunch, sebuah studi terbaru yang diterbitkan dalam jurnal Science mengungkapkan bahwa Large Language Model (LLM) menunjukkan performa luar biasa dalam konteks medis nyata. Penelitian yang dipimpin oleh tim dokter dan ilmuwan komputer dari Harvard Medical School serta Beth Israel Deaconess Medical Center ini menguji bagaimana model AI OpenAI dibandingkan dengan dokter manusia dalam menangani kasus di unit gawat darurat.

Dalam eksperimen tersebut, para peneliti berfokus pada 76 pasien yang masuk ke IGD Beth Israel. Mereka membandingkan diagnosis yang diberikan oleh dua dokter spesialis (attending physicians) dengan diagnosis yang dihasilkan oleh model OpenAI o1 dan 4o. Hasil diagnosis tersebut kemudian dinilai oleh dokter spesialis independen yang tidak mengetahui mana diagnosis yang berasal dari manusia dan mana yang dihasilkan oleh AI.

Performa Unggul di Tahap Kritis

Studi mencatat bahwa pada setiap titik kontak diagnostik, model o1 menunjukkan performa yang secara nominal lebih baik atau setara dengan dokter manusia dan model 4o. Perbedaan ini sangat mencolok pada tahap triage awal IGD, di mana ketersediaan informasi pasien berada pada titik terendah namun urgensi untuk membuat keputusan tepat berada pada tingkat tertinggi.

Berdasarkan data penelitian, model o1 berhasil memberikan diagnosis yang tepat atau sangat mendekati dalam 67% kasus triage. Sebagai perbandingan, salah satu dokter spesialis memberikan diagnosis yang tepat dalam 55% kasus, sementara dokter lainnya mencatat akurasi 50%.

"Kami menguji model AI terhadap hampir setiap tolok ukur (benchmark), dan hasilnya melampaui model sebelumnya serta basis data dokter kami," ujar Arjun Manrai, kepala laboratorium AI di Harvard Medical School. Peneliti juga menekankan bahwa mereka tidak melakukan pre-processing data; AI disajikan dengan informasi mentah yang sama dengan yang tersedia di electronic medical records pada saat diagnosis dilakukan.

Batasan dan Tantangan Akuntabilitas

Meski menunjukkan hasil yang menjanjikan, para peneliti menegaskan bahwa studi ini tidak mengklaim AI siap menggantikan dokter dalam membuat keputusan hidup-mati secara mandiri. Saat ini, model yang diuji masih terbatas pada pemrosesan informasi berbasis teks, sementara penalaran medis sering kali melibatkan input non-teks yang lebih kompleks.

Adam Rodman, dokter dari Beth Israel sekaligus salah satu penulis utama studi, menyatakan kepada The Guardian bahwa saat ini belum ada kerangka kerja formal untuk akuntabilitas diagnosis AI. Selain itu, aspek emosional pasien tetap memerlukan sentuhan manusia. Pasien tetap menginginkan manusia untuk membimbing mereka melalui keputusan perawatan yang menantang dan krusial bagi nyawa mereka.

Dampak bagi Indonesia

Perkembangan AI dalam diagnosis medis ini memiliki relevansi besar bagi ekosistem kesehatan di Indonesia:

Pemerataan Kualitas Diagnosis: Teknologi ini berpotensi menjadi asisten bagi tenaga medis di Puskesmas atau RSUD daerah terpencil yang seringkali kekurangan dokter spesialis, sehingga membantu proses skrining awal yang lebih presisi sebelum pasien dirujuk ke fasilitas lebih besar.
Integrasi Rekam Medis Elektronik (RME): Sejalan dengan mandat Kemenkes mengenai kewajiban RME, implementasi AI dapat membantu otomatisasi analisis data pasien secara real-time untuk meminimalisir risiko kesalahan diagnosis akibat beban kerja dokter yang tinggi.
Regulasi dan Etika Medis: Pemerintah Indonesia perlu segera mengkaji regulasi terkait tanggung jawab hukum malpraktik jika melibatkan saran dari AI. Hal ini krusial mengingat aspek hukum kesehatan di Indonesia sangat menekankan pada kompetensi tenaga medis manusia.
Kebutuhan Infrastruktur Data: Adopsi teknologi ini memerlukan investasi pada Cloud Computing yang patuh pada aturan kedaulatan data pasien di dalam negeri serta standar Cybersecurity yang ketat guna mencegah kebocoran data medis.

--- Artikel ini akan diperbarui seiring tersedianya informasi baru. Join Komunitas Rekayasa AI di Discord untuk diskusi lebih lanjut.

Studi Harvard: AI o1 Ungguli Akurasi Diagnosis Dokter Gawat Darurat

Studi Harvard: AI o1 Ungguli Akurasi Diagnosis Dokter Gawat Darurat

Performa Unggul di Tahap Kritis

Batasan dan Tantangan Akuntabilitas

Dampak bagi Indonesia

Tim Rekayasa AI

Artikel Terkait

Biaya AI Membengkak: Industri Berjuang Kendalikan Pengeluaran 'Token' yang Merajalela

AirTrunk Gelontorkan $30 Miliar Bangun 5GW Data Center AI di India

Google Bayar SpaceX US$920 Juta Per Bulan demi Perkuat Infrastruktur AI