Telset.id – Anthropic secara resmi membatalkan kebijakan kontroversial yang sengaja menurunkan performa Claude Fable 5 secara diam-diam bagi peneliti yang mengembangkan AI saingan. Perusahaan mengakui kesalahan dan berjanji membuat seluruh pengamanan menjadi transparan.
Dalam pernyataan resmi kepada WIRED, Anthropic menyatakan, “We’re changing Fable 5’s safeguards for frontier LLM development to make them visible. We made the wrong tradeoff and we apologize for not getting the balance right.” Keputusan ini diambil setelah mendapat kecaman keras dari komunitas riset AI global.
Sebelumnya, Anthropic merilis Claude Fable 5 dengan pendekatan ganda. Untuk pertanyaan terkait keamanan siber, biologi, atau kimia, perusahaan akan mengarahkan pengguna ke model yang kurang canggih. Namun, untuk peneliti yang berusaha melatih model AI kompetitor—yang dilarang dalam syarat layanan—Anthropic memilih mendegradasi performa model secara diam-diam.
Langkah ini dinilai sebagai bentuk sabotase terselubung yang berbahaya bagi ekosistem riset AI. Dean Ball, senior fellow di Foundation for American Innovation dan mantan penasihat Gedung Putih, menulis di X bahwa “degrading performance on ML research *without telling the user* is shockingly hostile and a terrible look.” Ia menambahkan bahwa kebijakan ini justru merusak posisi Anthropic dalam mendorong keamanan AI kolaboratif.
Will Brown, research lead di startup open source AI Prime Intellect, mengatakan kebijakan tersebut menimbulkan ketidakpastian bagi pengembang. “It felt like Anthropic was saying to the public, ‘We don’t trust anybody else to do AI research. We are the only ones who have to do AI research. It feels a bit like they’re starting to pull the ladder up behind them,'” ujarnya.
Dampak Kebijakan Rahasia pada Ekosistem Riset
Brown juga menyoroti bahwa kebijakan tersebut akan membuat pengembang tidak tahu apakah mereka melanggar aturan, karena tidak ada notifikasi saat pengamanan diaktifkan. Dampaknya bisa meluas ke ekosistem pihak ketiga seperti perusahaan evaluasi yang menguji model-model frontier, termasuk Fitur Terbaru dari Claude Fable 5.
Anthropic beralasan bahwa langkah ini diambil karena Claude semakin efektif dalam mempercepat riset AI. Dalam blog terbaru, perusahaan menyebut kekhawatiran bahwa AI bisa meningkatkan kemampuannya lebih cepat dari kemampuan masyarakat beradaptasi. Mereka berargumen bahwa memperlambat atau menghentikan sementara pengembangan AI frontier bisa memberikan waktu bagi struktur sosial dan riset alignment untuk mengejar ketertinggalan.
Namun, kritikus menilai bahwa kebijakan rahasia ini justru menciptakan masa depan di mana hanya segelintir laboratorium AI besar yang bisa melakukan riset lanjutan. Hal ini bertentangan dengan semangat kolaborasi yang diperlukan untuk mengatasi tantangan keamanan AI.
Perusahaan juga menyebutkan bahwa pengamanan ini mencegah musuh asing menggunakan model paling canggih untuk risiko keamanan. “These safeguards prevent foreign adversaries from using our most capable models in ways that pose severe safety risks,” demikian pernyataan Anthropic. Mereka menambahkan bahwa pengamanan tersembunyi lebih sulit untuk diuji dan diakali, sehingga bisa ditargetkan secara lebih sempit.
Baca Juga:
Kini, setelah kebijakan direvisi, Anthropic akan memberi tahu pengguna jika mereka mencurigai adanya upaya membangun AI yang sangat canggih. Peringatan akan muncul berupa penolakan permintaan atau pengalihan ke model yang kurang canggih. Namun, perusahaan mengakui bahwa pengamanan yang terlihat ini harus menjaring lebih luas, sehingga lebih banyak permintaan yang sebenarnya tidak berbahaya mungkin akan terpicu. Anthropic berjanji bekerja cepat untuk membuat pengklasifikasinya lebih presisi.
Kontroversi ini menambah catatan panjang Anthropic dalam mengelola pengembangan AI. Sebelumnya, perusahaan telah mengambil langkah untuk membatasi kompetitor menggunakan Claude dalam membangun model AI tertutup maupun terbuka. Namun, langkah degradasi rahasia ini dinilai melampaui batas etika riset.
Langkah transparansi ini diharapkan memulihkan kepercayaan komunitas riset. Namun, pengakuan Anthropic bahwa pengamanan yang terlihat akan memicu lebih banyak positif palsu menunjukkan bahwa keseimbangan antara keamanan dan keterbukaan masih menjadi tantangan besar. Perusahaan berjanji akan terus menyempurnakan sistemnya agar tidak menghambat riset yang sah.





Komentar
Belum ada komentar.