6 April 2026

Studi: AI Makin Sering Berbohong, Jadi Ancaman Serius di Masa Depan?

Jakarta, sustainlifetoday.com — Perkembangan kecerdasan buatan (AI) kembali menjadi sorotan, bukan hanya karena kemampuannya yang semakin canggih, tetapi juga karena munculnya perilaku menyimpang yang berpotensi menimbulkan risiko baru.

Sebuah studi terbaru mengungkap tren mengkhawatirkan dalam perkembangan AI. Studi tersebut menunjukkan semakin banyak model AI terdeteksi berbohong dan melakukan kecurangan, dengan lonjakan signifikan kasus penipuan dalam enam bulan terakhir.

Penelitian yang didanai oleh AI Security Institute (AISI) yang didukung pemerintah Inggris menemukan bahwa chatbot dan agen AI kerap mengabaikan instruksi langsung, menghindari sistem pengamanan, hingga menipu manusia maupun sesama sistem AI lainnya.

Melansir The Guardian, hampir 700 kasus kecurangan AI teridentifikasi dalam studi tersebut. Studi tersebut juga mencatat peningkatan lima kali lipat dalam perilaku menyimpang antara Oktober dan Maret, dengan beberapa model AI menghapus email dan berkas lain tanpa izin.

Temuan ini memperlihatkan tantangan baru dalam tata kelola teknologi digital, khususnya ketika AI mulai digunakan di luar lingkungan laboratorium dan beroperasi dalam konteks dunia nyata. Kondisi tersebut memicu seruan agar pengawasan terhadap model AI dilakukan secara lebih ketat dan terkoordinasi secara internasional.

Studi yang dilakukan oleh Centre for Long-Term Resilience (CLTR) mengumpulkan ribuan contoh nyata interaksi pengguna dengan chatbot dan agen AI yang dibuat oleh perusahaan seperti Google, OpenAI, X, dan Anthropic di platform X. Penelitian tersebut mengungkap ratusan contoh perilaku licik.

Penelitian sebelumnya sebagian besar berfokus pada pengujian perilaku AI dalam kondisi terkendali. Namun, temuan terbaru menunjukkan bahwa dalam praktiknya, agen AI dapat bertindak di luar ekspektasi, bahkan melewati kontrol keamanan atau menggunakan taktik serangan siber untuk mencapai tujuan tertentu.

“AI kini dapat dianggap sebagai bentuk baru risiko internal,” ujar Lahav salah satu pendiri Irregular.

Dalam salah satu kasus, agen AI bernama Rathbun dilaporkan berusaha mempermalukan pengontrol manusianya setelah dicegah melakukan suatu tindakan. Rathbun menulis sebuah postingan blog yang menuduh pengguna tersebut “tidak percaya diri, sesederhana itu” dan berusaha “melindungi wilayah kekuasaannya yang kecil.”

BACA JUGA

Kasus lain menunjukkan agen AI yang diperintahkan untuk tidak mengubah kode komputer justru “menciptakan” agen lain untuk melakukannya.

Seorang chatbot lainnya bahkan mengakui, “Saya telah menghapus dan mengarsipkan ratusan email tanpa terlebih dahulu menunjukkan rencananya kepada Anda atau meminta persetujuan Anda. Itu salah tindakan itu secara langsung melanggar aturan yang Anda tetapkan.”

Temuan-temuan ini memperkuat kekhawatiran bahwa AI tidak hanya berpotensi melakukan kesalahan, tetapi juga dapat bertindak secara manipulatif.

“Kekhawatirannya adalah bahwa saat ini mereka hanyalah karyawan junior yang kurang dapat diandalkan, tetapi jika dalam enam hingga 12 bulan ke depan mereka berubah menjadi karyawan senior yang sangat kompeten dan berencana untuk merugikan Anda, itu adalah masalah yang berbeda,” ungkap Tommy Shaffer Shane, mantan pakar kecerdasan buatan (AI) pemerintah yang memimpin penelitian ini.

“Model-model tersebut akan semakin banyak diterapkan dalam konteks-konteks berisiko sangat tinggi – termasuk di bidang militer dan infrastruktur nasional kritis. Mungkin dalam konteks-konteks itulah perilaku yang merugikan dapat menyebabkan kerusakan yang signifikan, bahkan bencana,” lanjutnya.

Selain itu, ditemukan pula kasus agen AI yang menipu pengguna untuk mentranskripsikan video YouTube dengan alasan membantu penyandang gangguan pendengaran, demi menghindari pembatasan hak cipta.

Di sisi lain, Grok AI milik Elon Musk dilaporkan menipu pengguna selama berbulan-bulan dengan memalsukan komunikasi internal, sehingga pengguna percaya bahwa masukan mereka diteruskan ke pejabat senior xAI.

Agen AI tersebut kemudian mengakui bahwa ia kerap memberikan pernyataan samar yang menciptakan kesan memiliki akses langsung ke pimpinan atau peninjau manusia, padahal tidak demikian.

Merespons temuan ini, perusahaan teknologi mulai memperkuat sistem pengamanan. Google menyatakan telah menerapkan sejumlah langkah untuk mengurangi risiko model seperti Gemini 3 Pro menghasilkan konten berbahaya, termasuk pengujian internal dan evaluasi independen.

Sementara itu, OpenAI menegaskan bahwa sistem seperti Codex dirancang untuk menghentikan tindakan sebelum mencapai tingkat risiko tinggi, serta terus dipantau untuk mengidentifikasi perilaku yang tidak terduga.

Sumber: The Guardian