S2: AI Agent Terbaru yang Bisa Gantikan Tugas Manusia di Komputer

REKOMENDASI
ARTIKEL TERKAIT

Telset.id – Bayangkan memiliki asisten pribadi yang bisa mengurus semua pekerjaan digital Anda—mulai dari memesan tiket pesawat hingga mencari diskon terbaik di Amazon. Kini, itu bukan lagi sekadar mimpi. Simular AI, startup berbasis kecerdasan buatan, baru saja meluncurkan S2, sebuah AI agent yang diklaim sebagai yang terbaik dalam mengoperasikan komputer dan smartphone.

AI agent seperti S2 diprediksi akan mengambil alih banyak tugas manusia di dunia digital. Namun, hingga saat ini, kebanyakan agent masih terlalu sering melakukan kesalahan untuk bisa benar-benar diandalkan. S2 hadir dengan pendekatan baru: menggabungkan model AI canggih seperti GPT-4o atau Claude 3.7 dengan model khusus yang dirancang untuk memahami antarmuka pengguna grafis (GUI).

Mengapa S2 Berbeda?

Menurut Ang Li, Co-founder dan CEO Simular, menggunakan komputer adalah masalah yang berbeda dibandingkan sekadar menjalankan model bahasa besar (LLM) atau menulis kode. “Agent yang menggunakan komputer membutuhkan pemahaman mendalam tentang bagaimana GUI bekerja,” jelas Li, yang sebelumnya adalah peneliti di Google DeepMind.

S2 dirancang untuk belajar dari pengalaman. Dengan modul memori eksternal, agent ini merekam setiap tindakan dan umpan balik pengguna, lalu menggunakannya untuk meningkatkan kinerja di masa depan. Hasilnya? S2 mampu menyelesaikan 34,5% tugas kompleks yang membutuhkan hingga 50 langkah—mengalahkan Operator milik OpenAI yang hanya mencapai 32%.

Uji Coba di Dunia Nyata

Dalam pengujian langsung, S2 menunjukkan keunggulannya. Agent ini berhasil menyelesaikan 50% tugas di AndroidWorld, benchmark untuk agent yang menggunakan smartphone, sementara pesaing terdekat hanya mencapai 46%. Namun, bukan berarti S2 sempurna. Saat diminta mencari kontak peneliti di balik OSWorld, agent ini justru terjebak dalam loop antara halaman proyek dan login Discord.

Victor Zhong, ilmuwan komputer di University of Waterloo dan salah satu pencipta OSWorld, percaya bahwa masa depan agent AI terletak pada kemampuan memahami GUI dengan lebih baik. “Sistem terbaik saat ini akan menyerupai Simular—menggabungkan beberapa model untuk menutupi kelemahan model tunggal,” ujarnya.

Manusia + AI = Solusi Terbaik?

Lantas, bagaimana jika agent AI masih sering gagal? Jawabannya mungkin terletak pada kolaborasi antara manusia dan mesin. CowPilot, plugin Chrome yang dikembangkan oleh tim Carnegie Mellon University, memungkinkan pengguna mengambil alih saat AI terjebak. Hasilnya? Kombinasi manusia-AI berhasil menyelesaikan 95% tugas, dengan intervensi manusia hanya dibutuhkan dalam 15% langkah.

Jeffrey Bigham, profesor di CMU yang mengawasi proyek ini, mengatakan, “Ide menggabungkan manusia dan agent hampir terlalu jelas—sulit dipercaya bahwa ini bukan cara kebanyakan orang memikirkannya.”

Jadi, apakah S2 dan agent sejenis siap menggantikan manusia? Belum sepenuhnya. Tapi satu hal pasti: masa depan pekerjaan digital akan semakin otomatis—dan kita mungkin hanya perlu mengawasi dari belakang.

TINGGALKAN KOMENTAR

Silakan masukkan komentar anda!
Silakan masukkan nama Anda di sini

ARTIKEL TEKINI
HARGA DAN SPESIFIKASI