📑 Daftar Isi

Ilustrasi Claude Opus 4.8, model AI terbaru dari Anthropic yang lebih jujur dan reflektif

Anthropic Rilis Claude Opus 4.8, AI Jujur yang Akui Ketidaktahuan

Penulis:Nur Hamzah
Terbit:
Diperbarui:
⏱️3 menit membaca
Bagikan:
  • Anthropic resmi meluncurkan Claude Opus 4.8, model AI flagship terbaru
  • Model ini dirancang lebih jujur, reflektif, dan empat kali lebih kecil kemungkinan berhalusinasi
  • Penguji awal melaporkan pengalaman seperti bekerja dengan rekan kerja sungguhan
  • Fitur kontrol upaya berpikir memungkinkan pengguna mengatur seberapa dalam AI bernalar
  • Dynamic Workflows memungkinkan Claude meluncurkan ratusan subagen paralel
  • Anthropic sedang mengerjakan model dengan kecerdasan lebih tinggi dari Opus
  • Claude Mythos Preview sudah diuji untuk pekerjaan keamanan siber
  • Model ini mengungguli GPT-5.5 dalam beberapa alur kerja agenik

Telset.id – Anthropic resmi meluncurkan Claude Opus 4.8, model AI flagship terbaru yang dirancang untuk menjadi lebih jujur, reflektif, dan secara signifikan mengurangi kecenderungan berhalusinasi. Dalam pengumuman resminya, Anthropic mengklaim model ini sekitar empat kali lebih kecil kemungkinannya dibandingkan pendahulunya untuk membiarkan kesalahan dalam kode yang ditulisnya tanpa memperingatkan pengguna.

Di tengah persaingan ketat perusahaan AI yang berlomba membuat model lebih cepat, lebih otonom, dan lebih agenik, Anthropic justru memilih fokus pada aspek yang kerap diabaikan: kemampuan AI untuk menyadari saat dirinya mungkin salah dan mengakuinya. Langkah ini menandai perubahan paradigma dalam pengembangan kecerdasan buatan, di mana kejujuran dan transparansi menjadi nilai jual utama.

Claude

Kolaborator yang Lebih Baik

Claude Opus 4.8 diposisikan sebagai kolaborator yang lebih baik. Anthropic menyebut para penguji awal melaporkan bahwa bekerja dengan Opus 4.8 terasa lebih seperti bekerja dengan rekan kerja sungguhan dibandingkan model sebelumnya. Menurut perusahaan, para penguji mengatakan model ini mengajukan pertanyaan yang lebih baik, menangkap kesalahannya sendiri, dan menolak ketika rencana tidak masuk akal, alih-alih sekadar menyetujui pengguna.

Salah satu kritik terbesar terhadap chatbot adalah banyak dari mereka menjadi “yes-men,” sering kali memvalidasi ide buruk, asumsi lemah, atau informasi yang salah, alih-alih menantang pengguna. Anthropic tampaknya condong ke arah yang sebaliknya. Perusahaan juga mengatakan Opus 4.8 menunjukkan peningkatan besar dalam penalaran hukum, pengkodean, agen peramban, dan tugas analisis panjang, dengan beberapa mitra akses awal mengklaim model ini mengungguli model Opus sebelumnya dan bahkan GPT-5.5 dalam beberapa alur kerja agenik.

Kontrol Upaya Berpikir

Bersamaan dengan model baru, Anthropic meluncurkan sistem kontrol upaya baru di dalam Claude. Pengguna kini dapat memutuskan seberapa banyak upaya berpikir yang dikeluarkan Claude untuk suatu tugas. Mode upaya lebih tinggi memungkinkan AI menghabiskan lebih banyak waktu untuk bernalar melalui respons, sementara pengaturan upaya lebih rendah memprioritaskan kecepatan dan penggunaan token yang lebih rendah.

Claude on a computer screen

Anthropic mengatakan Opus 4.8 secara default menggunakan “upaya tinggi” karena menawarkan keseimbangan terbaik antara kualitas dan kegunaan. Alih-alih chatbot langsung melontarkan respons, perusahaan semakin fokus membuat model untuk berhenti sejenak, bernalar, dan memverifikasi informasi sebelum menjawab. OpenAI, Google, dan Anthropic semuanya bergerak ke arah ini seiring sistem AI menjadi lebih otonom dan digerakkan oleh agen.

Alur Kerja Dinamis

Selain model baru, fitur pratinjau riset baru bernama Dynamic Workflows juga diumumkan. Fitur ini memungkinkan Claude meluncurkan ratusan subagen paralel selama satu tugas, memverifikasi pekerjaan, dan menggabungkan hasil sebelum merespons kembali ke pengguna. Menurut Anthropic, Claude Code kini dapat menangani migrasi basis kode besar yang melibatkan ratusan ribu baris kode dari awal hingga akhir.

Masa depan tampaknya semakin kurang seperti chatbot yang menjawab satu perintah pada satu waktu dan lebih seperti sistem otonom yang secara diam-diam mengoordinasikan beberapa proses AI di belakang layar. Ini sejalan dengan pengembangan AI Claude yang semakin kompleks dan otonom.

Isyarat Model Masa Depan

Anthropic juga memberi isyarat tentang sesuatu yang lebih besar yang akan datang dengan mengungkapkan bahwa mereka sedang mengerjakan “kelas model baru dengan kecerdasan bahkan lebih tinggi daripada Opus.” Perusahaan mengatakan beberapa organisasi sudah menguji sistem bernama Claude Mythos Preview untuk pekerjaan keamanan siber, meskipun Anthropic mengklaim model pada level itu akan memerlukan pengamanan yang lebih kuat sebelum dirilis lebih luas.

Dalam kaitannya dengan keamanan siber, Claude Mythos telah menunjukkan kemampuannya yang mengesankan dalam menemukan celah keamanan. Di saat yang sama, perusahaan AI terus mendorong sistem yang lebih kuat sambil juga mengakui bahwa generasi model berikutnya mungkin membawa risiko yang memerlukan standar keselamatan yang sama sekali baru.

Jelas bahwa Anthropic berusaha memposisikan AI seperti kolaborator yang hati-hati yang mempertanyakan dirinya sendiri, menandai ketidakpastian, dan berpikir lebih lama sebelum merespons. Sebuah strategi yang tampaknya sudah lama tertunda. Ironisnya, pengendalian diri itu mungkin pada akhirnya akan menjadi salah satu fitur AI paling berharga dari semuanya.

Dengan pendekatan yang menekankan kejujuran dan transparansi, Anthropic membedakan dirinya di tengah hiruk-pikuk pengembangan AI yang sering kali mengorbankan akurasi demi kecepatan. Claude Opus 4.8 menjadi bukti bahwa terkadang, AI yang paling berguna adalah AI yang tahu kapan harus diam dan mengakui keterbatasannya.

Komentar

Belum ada komentar.