Gak Cuma Chatbot! Kemampuan AI Agent Ini Bikin Pengacara Ketar-ketir

REKOMENDASI
ARTIKEL TERKAIT

Pernahkah Anda merasa begitu yakin bahwa profesi tertentu tidak akan pernah bisa disentuh oleh kecerdasan buatan? Sebulan yang lalu, rasa aman itu mungkin masih menyelimuti para profesional di bidang hukum. Banyak yang beranggapan bahwa nuansa, logika kompleks, dan interpretasi hukum adalah benteng terakhir yang mustahil ditembus oleh mesin. Namun, dalam hitungan minggu, peta kekuatan teknologi kembali berubah drastis, memaksa kita untuk meninjau ulang prediksi tersebut.

Bulan lalu, sebuah tolok ukur (benchmark) baru dari Mercor dirilis untuk mengukur kemampuan agen AI dalam tugas-tugas profesional tingkat tinggi, seperti hukum dan analisis korporat. Hasil awalnya bisa dibilang mengecewakan bagi para pengembang AI, namun menenangkan bagi manusia. Saat itu, setiap laboratorium AI besar mencatatkan skor di bawah 25%. Kesimpulan sementaranya sangat jelas: pengacara masih aman dari ancaman perpindahan tugas ke AI, setidaknya untuk saat itu.

Namun, di dunia teknologi yang bergerak secepat kilat, kata “aman” seringkali bersifat sementara. Pekan ini, lanskap tersebut terguncang hebat dengan rilisnya model terbaru dari Anthropic, yakni Opus 4.6. Model ini tidak hanya sekadar pembaruan minor, melainkan sebuah lompatan kapabilitas yang mengubah papan skor secara signifikan. Apa yang sebelumnya dianggap mustahil dilakukan oleh mesin dalam waktu dekat, kini mulai terlihat di depan mata.

Lonjakan Skor yang “Gila”

Perubahan drastis ini terlihat nyata pada papan peringkat Mercor. Model terbaru Anthropic, Opus 4.6, berhasil mencetak skor nyaris menyentuh angka 30% dalam uji coba one-shot (satu kali percobaan). Angka ini bahkan melonjak lebih tinggi hingga rata-rata 45% ketika AI diberikan kesempatan beberapa kali untuk memecahkan masalah yang sama. Kenaikan ini bukan sekadar statistik angka, melainkan indikasi bahwa pemahaman konteks pada kemampuan AI agent telah meningkat pesat.

CEO Mercor, Brendan Foody, tidak dapat menyembunyikan kekagumannya terhadap perkembangan ini. Ia secara spesifik menyoroti betapa cepatnya progres yang terjadi dalam waktu singkat. Menurutnya, lonjakan skor dari 18,4% menjadi 29,8% hanya dalam kurun waktu beberapa bulan adalah sesuatu yang “gila”. Hal ini menegaskan bahwa kemajuan pada model dasar (foundation models) sama sekali tidak melambat, melainkan justru berakselerasi.

Peningkatan performa ini tentu memicu diskusi hangat mengenai masa depan pekerjaan kerah putih. Meskipun CEO Nvidia pernah menyebutkan bahwa AI hanya mengambil alih Tugas Rutin, data terbaru ini menunjukkan bahwa AI mulai merambah ke ranah analisis yang lebih kompleks.

Peran Fitur Agent Swarms

Apa rahasia di balik lonjakan performa yang tiba-tiba ini? Salah satu faktor kunci yang disorot dalam rilis Anthropic kali ini adalah penyertaan sejumlah fitur agenik baru, termasuk apa yang disebut sebagai “agent swarms” atau kawanan agen. Fitur ini memungkinkan kolaborasi antar-sistem AI untuk menyelesaikan masalah yang bertingkat dan rumit.

Dalam konteks penyelesaian masalah hukum atau korporat yang seringkali membutuhkan pemikiran multistep, kehadiran agent swarms ini tampaknya memberikan dampak signifikan. Kemampuan untuk memecah masalah besar menjadi bagian-bagian kecil yang dikerjakan secara simultan atau berurutan oleh “kawanan” agen ini, membuat Agentic AI menjadi jauh lebih efektif dibandingkan model tunggal sebelumnya.

Teknologi ini mirip dengan bagaimana sebuah tim hukum bekerja, di mana berbagai aspek kasus ditangani oleh individu yang berbeda namun terkoordinasi. Jika tren ini berlanjut, bukan tidak mungkin kita akan melihat implementasi yang lebih luas, bahkan mungkin dalam penyusunan Aturan Pemerintah di masa depan yang menuntut ketelitian tinggi.

Apakah Pengacara Harus Mulai Panik?

Melihat data di atas, pertanyaan besarnya adalah: apakah para pengacara harus mulai khawatir akan digantikan oleh mesin minggu depan? Jawabannya, untuk saat ini, adalah tidak. Skor 30% atau bahkan 45% masih sangat jauh dari kesempurnaan 100%. Masih ada celah besar yang harus ditutup oleh teknologi sebelum benar-benar bisa menyamai kompetensi manusia sepenuhnya dalam ranah hukum profesional.

Namun, rasa percaya diri yang berlebihan yang mungkin dirasakan bulan lalu sebaiknya mulai dikurangi. Progres dari angka belasan persen menuju hampir setengah jalan (45%) dalam waktu singkat adalah sinyal peringatan yang nyata. Ini bukan lagi soal “apakah” AI bisa melakukan tugas tersebut, melainkan “kapan” AI akan mencapai tingkat akurasi yang dapat diandalkan secara komersial.

Perkembangan Opus 4.6 membuktikan bahwa batasan teknologi terus didorong lebih jauh setiap harinya. Bagi para profesional, ini adalah momen untuk tidak lagi memandang sebelah mata pada Jutaan AI yang sedang dikembangkan. Meskipun manusia masih memegang kendali saat ini, kecepatan inovasi menuntut kita untuk terus beradaptasi agar tidak tergilas oleh gelombang perubahan yang tak terelakkan ini.

TINGGALKAN KOMENTAR
Silakan masukkan komentar anda!
Silakan masukkan nama Anda di sini

ARTIKEL TERKINI
HARGA DAN SPESIFIKASI