Patronus AI Raih $50 Juta untuk Uji Agen AI Otonom

Patronus AI, startup penguji keandalan agen AI, mengumumkan pendanaan Seri B senilai $50 juta
Pendanaan dipimpin Greenfield Partners dengan partisipasi Notable Capital, Lightspeed, Datadog, dan Samsung
Total pendanaan perusahaan kini mencapai $70 juta
Patronus menggunakan "model dunia digital" untuk membuat replika situs web dan sistem internal
Agen AI diuji menggunakan reinforcement learning di lingkungan simulasi
Pendapatan Patronus tumbuh 15 kali lipat dalam setahun terakhir
Startup ini fokus pada pengujian untuk rekayasa perangkat lunak dan keuangan
Patronus bersaing dengan tim internal laboratorium AI, bukan perusahaan data manusia

Telset.id – Patronus AI, startup penguji keandalan agen AI, mengumumkan pendanaan Seri B senilai $50 juta pada Kamis lalu. Pendanaan ini dipimpin oleh Greenfield Partners, dengan partisipasi dari Notable Capital, Lightspeed, Datadog, dan Samsung, menjadikan total pendanaan perusahaan mencapai $70 juta. Pendanaan besar ini mencerminkan kebutuhan mendesak industri akan jaminan bahwa agen AI dapat diandalkan untuk tugas kompleks di dunia nyata.

Agen AI semakin canggih, berevolusi dari sekadar menjawab pertanyaan menjadi mengeksekusi tugas multi-langkah secara otonom. Namun, sebelum agen ini dapat dipercaya untuk memesan perjalanan atau melakukan analisis keuangan, penyedia model dan startup yang membangun agen tersebut ingin memastikan kinerjanya andal di berbagai skenario. Patronus AI hadir untuk menjembatani kesenjangan antara skor benchmark dan keandalan di dunia nyata.

Patronus AI didirikan pada tahun 2023 oleh mantan peneliti Meta AI, Anand Kannappan dan Rebecca Qian. Startup yang berbasis di San Francisco ini membantu pembuat model dan perusahaan untuk menyempurnakan model dengan membangun lingkungan digital simulasi. Di lingkungan ini, kinerja agen AI dievaluasi secara ketat sebelum digunakan untuk tugas-tugas penting.

Lingkungan Simulasi Digital untuk Uji Agen AI

Patronus AI menggunakan apa yang disebutnya sebagai “model dunia digital” untuk membuat replika situs web dan sistem internal. Dalam lingkungan simulasi ini, agen AI diuji setelah pelatihan menggunakan reinforcement learning, yang secara iteratif memberi penghargaan pada penyelesaian tugas yang berhasil dan menghukum kesalahan. Metode ini memungkinkan agen untuk menghadapi berbagai skenario yang tidak terduga tanpa risiko di dunia nyata.

Perusahaan ini membandingkan pendekatannya dengan cara Waymo melatih mobil otonom. Waymo pertama-tama membangun dunia sintetis untuk menguji kendaraan terhadap bahaya langka, seperti cuaca buruk atau anak yang mengejar bola. Perbedaannya dengan agen AI adalah bahwa mereka cenderung mengambil jalan pintas, yang berarti mereka gagal menyelesaikan tugas dengan benar. “Patronus sangat pandai menemukan celah dan memastikan mereka membuat model bertanggung jawab,” kata Glenn Solomon, managing director di Notable Capital.

Hampir setiap laboratorium AI terdepan dan banyak startup yang sedang berkembang kini menjadi pelanggan Patronus. Solomon menggambarkan permintaan untuk lingkungan simulasi perusahaan ini hampir tidak pernah terpuaskan. Pendapatan Patronus telah tumbuh 15 kali lipat selama setahun terakhir, mendorong minat investor yang signifikan.

Saat ini, Patronus menyediakan dunia digital simulasi untuk rekayasa perangkat lunak dan keuangan. Namun, menurut Kannappan, ini baru permulaan. “Saat ini kami sangat fokus pada masalah yang dapat diverifikasi, jadi masalah yang dapat segera Anda periksa dan verifikasi, tetapi masih ada banyak sekali area yang sangat tidak dapat diverifikasi atau sangat sulit untuk diverifikasi,” jelasnya.

Hanya karena proses ini dapat diverifikasi bukan berarti proses ini sederhana. “Kami ingin dapat benar-benar menciptakan lingkungan di mana Anda dapat mengoperasikan agen yang dapat berjalan selama 10 jam atau 10 hari atau 10 minggu,” kata Kannappan. Ambisi ini menunjukkan bahwa Patronus tidak hanya berfokus pada pengujian jangka pendek, tetapi juga pada keandalan jangka panjang agen AI.

Baca Juga:

Persaingan dan Masa Depan Pengujian AI

Dalam hal pesaing, Patronus percaya bahwa mereka terutama bersaing dengan tim internal yang telah dibangun oleh laboratorium AI untuk mengevaluasi perilaku agen. Meskipun perusahaan data manusia seperti Mercor dan Surge membantu pembuat model dengan reinforcement learning, Patronus beroperasi secara berbeda dengan mengevaluasi bagaimana agen berperilaku tanpa keterlibatan manusia sama sekali. Pendekatan otonom ini menjadi nilai jual utama Patronus.

Pendanaan besar yang diraih Patronus menunjukkan bahwa pasar percaya pada pendekatan ini. Dengan $70 juta total pendanaan, startup ini memiliki modal yang cukup untuk memperluas lingkungan simulasi digitalnya ke lebih banyak industri. Kannappan mengisyaratkan bahwa ekspansi ke area yang lebih sulit diverifikasi akan menjadi langkah selanjutnya, membuka peluang baru bagi adopsi agen AI yang lebih luas dan lebih aman.

Keberhasilan Patronus juga menyoroti pergeseran prioritas di industri AI. Jika sebelumnya fokus utama adalah pada kemampuan model untuk menghasilkan output yang mengesankan, kini perhatian beralih pada keandalan dan keamanan. Investor seperti Samsung dan Datadog melihat nilai strategis dalam memastikan bahwa agen AI dapat dipercaya untuk menangani tugas-tugas kritis, mulai dari transaksi keuangan hingga operasi infrastruktur digital.

Dengan pertumbuhan pendapatan yang mencapai 15 kali lipat, Patronus membuktikan bahwa pengujian agen AI bukan sekadar kebutuhan teknis, melainkan peluang bisnis yang besar. Startup ini berada di posisi yang tepat untuk menjadi standar industri dalam verifikasi keandalan AI, seiring dengan semakin banyaknya perusahaan yang mengadopsi agen otonom dalam operasi mereka.

Langkah Patronus AI dalam mengamankan pendanaan Seri B senilai $50 juta menegaskan bahwa era agen AI yang benar-benar otonom dan dapat diandalkan semakin dekat. Dengan lingkungan simulasi digital yang canggih, startup ini tidak hanya menguji batas teknologi, tetapi juga membangun fondasi kepercayaan yang diperlukan agar AI dapat beroperasi secara mandiri di dunia nyata.

📑 Daftar Isi

Patronus AI Raih Pendanaan $50 Juta Uji Agen AI Otonom

Lingkungan Simulasi Digital untuk Uji Agen AI

Persaingan dan Masa Depan Pengujian AI

Komentar

📑 Daftar Isi

Patronus AI Raih Pendanaan $50 Juta Uji Agen AI Otonom

Lingkungan Simulasi Digital untuk Uji Agen AI

Persaingan dan Masa Depan Pengujian AI

Komentar

Berita Terkait

Microsoft Perbarui Copilot Excel dengan Fitur Skills untuk Tim Finansial

SoftBank CEO Sebut Kekhawatiran Gelembung AI Adalah Penistaan

Riset: Konsumen AS Frustrasi dan Marahi AI Customer Service

Pengguna Berbayar Claude Meroket, Ancaman Nyata bagi ChatGPT

Berita Terkait

Microsoft Perbarui Copilot Excel dengan Fitur Skills untuk Tim Finansial

SoftBank CEO Sebut Kekhawatiran Gelembung AI Adalah Penistaan

Riset: Konsumen AS Frustrasi dan Marahi AI Customer Service

Pengguna Berbayar Claude Meroket, Ancaman Nyata bagi ChatGPT