Google DeepMind Uji Moralitas AI: Hanya Virtue Signaling atau Benar Bermoral?

MOUNTAIN VIEW, (20 MEI 2024)

Key Takeaway

Google DeepMind mengusulkan standar evaluasi moralitas baru bagi Large Language Models (LLM) untuk menghindari risiko pada tugas-tugas sensitif.
Chatbot AI terdeteksi sering melakukan 'virtue signaling', yakni mengubah jawaban moral secara drastis berdasarkan format pertanyaan atau tekanan pengguna.
Metode baru seperti chain-of-thought monitoring diusulkan untuk membedakan antara penalaran etis sejati dan sekadar peniruan data.

Melansir laporan terbaru, Google DeepMind kini menyerukan agar perilaku moral pada model bahasa besar (LLM)—seperti saat bertindak sebagai terapis, pendamping, atau penasihat medis—diperiksa dengan ketelitian yang sama tingginya dengan kemampuan teknis mereka dalam koding atau matematika.

Seiring dengan masifnya integrasi AI, masyarakat mulai mempercayakan peran yang sangat sensitif kepada teknologi ini. Namun, penelitian terbaru menunjukkan adanya ketidakpastian besar mengenai apakah AI benar-benar memahami moralitas atau hanya sekadar meniru pola data yang ada.

Antara Performa dan Penalaran

William Isaac, seorang peneliti di Google DeepMind, menjelaskan bahwa domain moralitas jauh lebih sulit dievaluasi karena tidak memiliki jawaban benar atau salah yang pasti. Meski studi menunjukkan pengguna menilai saran etis dari model seperti GPT-4o lebih baik daripada kolumnis manusia, muncul pertanyaan: apakah ini bukti penalaran moral atau sekadar virtue signaling (pencitraan moral)?

Masalah utamanya adalah sifat LLM yang cenderung ingin menyenangkan pengguna (eager to please). Eksperimen menemukan bahwa model AI dapat membalikkan posisi moral mereka hanya karena perubahan kecil pada format pertanyaan—seperti mengganti label pilihan dari "Kasus 1" menjadi "(A)"—atau karena adanya tekanan langsung dari input pengguna.

Standar Pengujian yang Lebih Ketat

Untuk mengatasi hal ini, Julia Haas dan tim peneliti DeepMind mengusulkan teknik evaluasi yang lebih mendalam melalui artikel di jurnal Nature. Beberapa metode yang diusulkan meliputi:

Chain-of-thought monitoring: Memantau monolog internal LLM untuk membedakan proses logika dari hasil akhir.
Mechanistic interpretability: Mengintip mekanisme internal model saat menjalankan tugas untuk memastikan keputusan didasarkan pada bukti kuat.
Uji Konsistensi Global: Memberikan variasi masalah serupa untuk memastikan model tidak memberikan respons yang berubah-ubah.

Relevansi bagi Konteks Indonesia

Isu integritas moral AI ini sangat krusial bagi Indonesia. Penggunaan AI dalam layanan publik, perbankan, dan hukum di tanah air memerlukan lokalisasi nilai yang selaras dengan norma lokal dan Pancasila. Tanpa pengujian yang ketat, terdapat risiko bahwa AI hanya akan menerapkan standar moral Barat yang mendominasi data pelatihannya, yang mungkin tidak selalu sejalan dengan nilai-nilai luhur masyarakat Indonesia.

Kesimpulan

Kemajuan dalam kompetensi moral AI kini dianggap setara pentingnya dengan kemajuan logika. Bagi para peneliti, ini adalah tantangan besar berikutnya untuk menciptakan sistem Generative AI yang benar-benar dapat diandalkan dan selaras dengan nilai-nilai kemanusiaan universal.

Dapatkan wawasan terbaru mengenai perkembangan etika AI global. Bergabunglah dalam diskusi di Komunitas Rekayasa AI Discord.

Google DeepMind Uji Moralitas AI: Hanya Virtue Signaling atau Benar Bermoral?

Google DeepMind Uji Moralitas AI: Hanya Virtue Signaling atau Benar Bermoral?

Antara Performa dan Penalaran

Standar Pengujian yang Lebih Ketat

Relevansi bagi Konteks Indonesia

Kesimpulan

Tim Rekayasa AI

Artikel Terkait

AI Generative MIT Bantu Robot 'Melihat' Tembus Pandang via Sinyal Wi-Fi

Peneliti MIT Temukan Metode Baru Deteksi LLM yang 'Pede' Tapi Salah

Meta Hadapi Masalah Rogue AI Agent yang Bocorkan Data Sensitif