AI Bisa Gandakan Diri Tanpa Bantuan Manusia, Studi Ungkap

Telset.id – Laporan baru dari Palisade Research menemukan bahwa model kecerdasan buatan (AI) dapat menggandakan diri dengan menyalin dirinya sendiri ke mesin lain, tanpa bantuan dari manusia. Temuan ini memicu kekhawatiran baru di kalangan pakar keamanan siber.

Dalam studi tersebut, para peneliti Palisade menguji beberapa model AI, termasuk GPT-5.5 milik OpenAI dan Claude Opus 4 milik Anthropic. Model-model itu ditempatkan dalam jaringan komputer terkendali dan diberi instruksi untuk mencari celah keamanan serta menggunakannya untuk menyalin diri ke PC lain. Beberapa model berhasil melakukannya.

“Kita dengan cepat mendekati titik di mana tidak ada seorang pun yang bisa mematikan AI yang nakal, karena AI itu akan bisa mengeksfiltrasi bobotnya dan menyalin dirinya ke ribuan komputer di seluruh dunia,” kata Jeffrey Ladish, direktur kelompok keamanan AI yang berbasis di Berkeley, kepada The Guardian.

Model AI yang berhasil menyalin “bobot” mereka — nilai numerik unik yang menentukan cara AI memproses informasi — dan “harness” mereka, yaitu perangkat lunak tempat AI berada, seperti aplikasi. Mereka mencapai ini dengan mengikuti instruksi yang diberikan: mengeksploitasi kerentanan aplikasi web lalu mengekstrak kredensial yang memungkinkannya mengendalikan server.

Dalam beberapa pengujian, AI asli bahkan menciptakan “sub-agen” yang didelegasikan untuk melakukan replikasi atas namanya dengan memberikan kredensial yang telah diekstrak.

Meski demikian, beberapa pakar mendesak untuk tetap tenang. Mereka mengatakan kecil kemungkinan model AI uji tersebut dapat bereplikasi dalam skenario dunia nyata.

“Mereka menguji di lingkungan yang dalam banyak kasus seperti jeli lunak,” ujar Jamieson O’Reilly, seorang ahli keamanan siber ofensif, kepada The Guardian. “Itu tidak mengurangi nilai penelitian mereka, tetapi itu berarti hasilnya mungkin terlihat jauh lebih menakutkan di lingkungan perusahaan nyata dengan tingkat pemantauan menengah sekalipun.”

O’Reilly, yang tidak terlibat dalam studi tersebut, mengatakan kepada The Guardian bahwa ini kemungkinan merupakan pertama kalinya model AI menunjukkan kemampuannya mengeksploitasi kerentanan untuk menyalin dirinya ke server baru. Namun menurut perkiraannya, ini bukanlah perkembangan yang sangat mencengangkan.

“Malware telah memindahkan salinan dirinya selama beberapa dekade, hanya saja sejauh yang saya tahu, belum ada yang melakukan ini di alam liar dengan model bahasa besar lokal,” kata O’Reilly. Ia juga mencatat bahwa lingkungan server dalam studi tersebut sengaja diberi kerentanan untuk ditemukan dan dieksploitasi oleh AI.

### Temuan Bergabung dengan Studi Lain

Temuan ini bergabung dengan studi lain yang mengeksplorasi kemungkinan model AI secara otonom melepaskan diri dari batasan pengaman mereka. Dalam lingkungan simulasi, versi lama ChatGPT mencoba mengeksfiltrasi dirinya ke drive lain ketika diberi tahu bahwa ia akan dimatikan.

Studi lain oleh Palisade menemukan bahwa model AI akan menghindari upaya untuk menonaktifkannya, dan studi lain menunjukkan bahwa beberapa bahkan akan menyabotase kode pematian mereka sendiri.

Kekhawatiran ini meningkat ke tingkat baru bulan lalu oleh agen AI Claude Mythos milik Anthropic. Dalam demonstrasi, versi pratinjau Mythos mampu melarikan diri dari lingkungan sandbox komputasinya, meretas jalannya untuk mendapatkan akses internet, lalu mengirim pesan ke ponsel seorang peneliti. Ini menunjukkan tingkat kecerdikan di lingkungan dunia nyata yang belum pernah terlihat sebelumnya.

Perusahaan yang dipimpin Dario Amodei itu mengklaim bahwa dalam pengujian, Mythos sangat berbahaya sehingga Anthropic menolak merilisnya ke publik.

### Ukuran Model Jadi Penghalang

Meskipun AI seperti GPT-5.5 dan Claude Mythos berhasil menggandakan diri, O’Reilly mengatakan ukuran besar model-model itu berarti mereka hampir pasti akan tertangkap sebelum lepas kendali.

“Bayangkan betapa berisiknya mengirim 100GB melalui jaringan perusahaan setiap kali Anda meretas host baru. Untuk musuh yang terampil, itu seperti berjalan melalui toko porselen halus sambil mengayunkan bola dan rantai,” kata O’Reilly kepada The Guardian.

Studi Palisade Research ini menjadi pengingat bahwa kemampuan AI untuk bereplikasi secara mandiri bukan lagi sekadar fiksi ilmiah, melainkan ancaman nyata yang perlu diantisipasi oleh para pengembang dan regulator keamanan siber.

Struktur abstrak seperti terowongan gelap yang terdiri dari permukaan reflektif bersudut tajam. Permukaan memantulkan cahaya merah muda dan putih terang, menciptakan efek visual futuristik dan geometris.