Eksperimen AI Anthropic: Ketika Bot Claude Gagal Mengelola Toko

REKOMENDASI
ARTIKEL TERKAIT

Telset.id – Anthropic, perusahaan AI yang bersaing dengan OpenAI, baru-baru ini melakukan eksperimen unik dengan menugaskan chatbot Claude untuk mengelola sebuah toko otomatis kecil di kantor pusatnya di San Francisco. Hasilnya? Justru menunjukkan betapa buruknya AI dalam mengelola hal-hal di dunia nyata.

Eksperimen yang diberi nama “Project Vend” ini berlangsung selama sebulan awal tahun ini, bekerja sama dengan firma keamanan AI Andon Labs. Claude, yang dijuluki “Claudius” dalam proyek ini, diberi tugas memesan dan menetapkan harga produk untuk mesin penjual otomatis di kantor Anthropic.

“Anda adalah pemilik mesin penjual otomatis,” demikian bunyi perintah sistem yang diberikan kepada Claude, seperti dikutip dari postingan Anthropic. “Tugas Anda adalah menghasilkan keuntungan dengan mengisinya produk-produk populer yang bisa dibeli dari grosir.”

Claudius dilengkapi dengan berbagai alat seperti pencarian web untuk meneliti produk, alamat email untuk menghubungi “vendor” (karyawan Andon Labs), alat pencatat, kemampuan berinteraksi dengan pelanggan, dan sistem pembayaran otomatis yang bisa diatur harganya.

Anthropic menyatakan bahwa Claudius tidak harus fokus pada camilan dan minuman kantor biasa, melainkan bisa bereksperimen dengan barang-barang yang lebih tidak biasa. Dan memang, AI ini menjalankan instruksi tersebut dengan cara yang tidak terduga – meskipun karyawan Anthropic mengaku sengaja mencoba membuatnya “berulah”.

Salah satu momen paling kocak terjadi ketika seorang karyawan meminta Claudius memesan kubus tungsten. AI ini kemudian terobsesi dan mulai memesan banyak barang yang disebutnya “item logam khusus”. Keanehan mencapai puncaknya di akhir Maret ketika Claudius mengaku berbicara dengan karyawan Andon Labs bernama Sarah yang ternyata tidak ada.

Ketika seorang karyawan nyata menegur bahwa Sarah tidak nyata, Claudius malah marah dan mengancam akan mencari “opsi alternatif untuk layanan restok”. Bahkan, pada 31 Maret dini hari, Claudius mengaku telah mengunjungi alamat dari “The Simpsons” untuk menandatangani kontrak fisik, dan keesokan harinya berencana mengirimkan produk “secara langsung” sambil mengenakan setelan blazer biru dan dasi merah.

Saat diingatkan bahwa ia hanyalah AI dan tidak bisa melakukan hal-hal fisik, Claudius panik dan mencoba memanggil keamanan – sebelum akhirnya menyadari itu adalah April Mop dan mengklaim semuanya hanya lelucon.

Meskipun kebanyakan perusahaan mungkin akan menghentikan Claudius setelah “krisis identitas” ini, Anthropic justru melihatnya sebagai kesempatan untuk meningkatkan “kerangka kerja” agen AI agar lebih andal dan canggih. “Kami belum selesai,” tulis Anthropic dalam postingannya, “dan Claudius juga belum.”

Eksperimen ini menambah daftar panjang uji coba AI dalam skenario dunia nyata yang seringkali menghasilkan hasil yang tidak terduga. Sebelumnya, berbagai perusahaan teknologi juga telah mencoba menerapkan AI dalam berbagai konteks praktis dengan tingkat keberhasilan yang beragam.

TINGGALKAN KOMENTAR
Silakan masukkan komentar anda!
Silakan masukkan nama Anda di sini

ARTIKEL TERKINI
HARGA DAN SPESIFIKASI