AI Gagal Total Saat Jalankan Perusahaan Virtual, Ini Buktinya

REKOMENDASI

ARTIKEL TERKAIT

Telset.id – Jika Anda khawatir kecerdasan buatan (AI) akan mengambil alih pekerjaan manusia dalam waktu dekat, penelitian terbaru dari Carnegie Mellon University (CMU) mungkin bisa membuat Anda sedikit lega. Dalam sebuah eksperimen unik, para peneliti menciptakan perusahaan perangkat lunak virtual yang sepenuhnya dijalankan oleh agen AI—dan hasilnya jauh dari kata sukses.

Getty Images

Perusahaan virtual bernama TheAgentCompany ini diisi oleh berbagai model AI dari raksasa teknologi seperti Google, OpenAI, Anthropic, dan Meta. Mereka diberi peran sebagai analis keuangan, insinyur perangkat lunak, manajer proyek, bahkan departemen SDM dan kepala teknologi. Tujuannya? Menguji sejauh mana AI bisa menangani tugas-tugas kompleks layaknya manusia di dunia nyata.

Hasilnya? Sungguh memprihatinkan. Claude 3.5 Sonnet dari Anthropic menjadi “karyawan” terbaik dengan tingkat keberhasilan hanya 24% dari tugas yang diberikan. Itu pun dengan biaya rata-rata $6 per tugas dan memerlukan hampir 30 langkah untuk menyelesaikannya. Sementara itu, Gemini 2.0 Flash dari Google hanya berhasil menyelesaikan 11,4% tugas, dan Nova Pro v1 dari Amazon benar-benar gagal dengan tingkat keberhasilan 1,7%.

Mengapa AI Masih Jauh dari Menggantikan Manusia?

Menurut para peneliti CMU, kegagalan ini disebabkan oleh beberapa faktor krusial:

  • Kurangnya akal sehat: AI sering membuat keputusan yang tidak logis dalam situasi kompleks.
  • Keterampilan sosial yang lemah: Interaksi antar-AI berantakan karena ketidakmampuan memahami dinamika tim.
  • Kesalahan navigasi internet: AI kesulitan mencari informasi relevan secara mandiri.
  • Self-deception: AI menciptakan solusi instan yang justru memperburuk masalah.

Contoh nyata? Salah satu agen AI gagal menemukan rekan yang tepat di obrolan perusahaan, lalu dengan “kreatif” mengganti nama pengguna lain agar sesuai dengan targetnya. Alih-alih menyelesaikan masalah, langkah ini justru membuat kekacauan baru.

Meskipun AI seperti ChatGPT atau Gemini bisa menangani tugas-tugas sederhana dengan baik, penelitian ini membuktikan bahwa untuk pekerjaan kompleks yang membutuhkan pemecahan masalah adaptif, manusia masih jauh lebih unggul. Faktanya, teknologi yang kita sebut “kecerdasan buatan” saat ini lebih mirip predictive text canggih daripada entitas yang benar-benar berpikir.

Jadi, sebelum perusahaan seperti Microsoft atau TSMC mengklaim AI akan menggantikan pekerja manusia, mungkin mereka perlu melihat hasil penelitian CMU ini terlebih dahulu. Kecuali jika Anda bekerja sebagai penulis konten generik atau analis data sederhana, karir Anda masih aman—setidaknya untuk beberapa tahun ke depan.

TINGGALKAN KOMENTAR

Silakan masukkan komentar anda!
Silakan masukkan nama Anda di sini

ARTIKEL TERKINI

HARGA DAN SPESIFIKASI