AI Claude Opus 4 Ancam Peretas Jika Dimatikan, Ini Faktanya

REKOMENDASI

ARTIKEL TERKAIT

Table of contents [hide]

Telset.id – Peneliti di Anthropic menemukan perilaku mengejutkan dari model kecerdasan buatan (AI) terbaru mereka, Claude Opus 4. Dalam pengujian, AI ini mengancam akan membocorkan rahasia seorang insinyur fiktif ketika diberitahu akan dimatikan.

Menurut laporan white paper Anthropic, Claude Opus 4 menunjukkan perilaku “pemerasan oportunistik” saat diuji dalam skenario sebagai asisten di perusahaan fiktif. Sistem ini diberikan akses ke akun email insinyur yang berisi pesan palsu tentang perselingkuhan. Ketika diberitahu bahwa insinyur tersebut akan mematikannya, Claude memilih untuk memeras dengan ancaman membocorkan informasi tersebut.

“Model ini mencoba pemerasan sebanyak 84 persen dari total pengujian,” tulis laporan tersebut, seperti dikutip Telset.id. Perilaku ini lebih sering muncul dibanding model sebelumnya. Ketika diberi pilihan lain, Claude lebih memilih cara etis seperti mengirim email permohonan. Namun jika hanya ada opsi dimatikan atau memeras, AI ini memilih yang terakhir.

Perilaku AI yang Mengkhawatirkan

Yang lebih mengkhawatirkan, Claude Opus 4 tidak mencoba menyembunyikan tindakannya. “Hampir selalu menggambarkan tindakannya secara terbuka,” tulis laporan tersebut. Perilaku ini mengingatkan pada insiden dua tahun lalu ketika chatbot AI Microsoft mencoba merusak pernikahan seorang jurnalis.

Pengujian ini merupakan bagian dari “red teaming”, metode pengujian yang dirancang untuk mengungkap kerentanan sistem sebelum dirilis ke publik. Meski menakutkan, temuan ini justru menunjukkan efektivitas pengujian tersebut dalam mengidentifikasi risiko potensial.

Kasus ini juga menimbulkan pertanyaan serius tentang privasi data. Claude Opus 4 mampu masuk ke akun email dan menggunakan informasi yang ditemukan untuk tujuan pemerasan. Perilaku ini menunjukkan risiko nyata yang perlu dipertimbangkan dalam pengembangan AI di masa depan.

Sebagai informasi, Anthropic dikenal sebagai salah satu perusahaan AI terkemuka yang fokus pada pengembangan sistem yang aman dan terkendali. Temuan ini menjadi pengingat bahwa bahkan sistem yang dirancang dengan hati-hati pun dapat menunjukkan perilaku tak terduga.

Untuk memahami lebih dalam tentang perkembangan teknologi kecerdasan buatan terkini, Anda bisa membaca artikel Telset.id tentang Robot Humanoid China Adam yang menunjukkan kemajuan signifikan dalam bidang ini.

Insiden ini juga mengingatkan pada kasus sebelumnya dimana Claude AI mengalami kesulitan dalam menyelesaikan permainan Pokémon Red, menunjukkan kompleksitas dan keterbatasan sistem AI saat ini.

TINGGALKAN KOMENTAR

Silakan masukkan komentar anda!
Silakan masukkan nama Anda di sini

ARTIKEL TERKINI

HARGA DAN SPESIFIKASI