Telset.id, Jakarta – Elon Musk, CEO Tesla dan X (sebelumnya Twitter), menyampaikan pandangan mengejutkan tentang pelatihan model AI, dia mengganggap bahwa data di dunia nyata semakin sedikit atau dengan kata lain telah terjadi krisis data AI.
Dalam wawancara live-stream di X dengan Mark Penn, Musk mengungkapkan bahwa data dunia nyata untuk melatih AI semakin habis. Menurutnya, puncak data manusia telah dicapai pada tahun lalu, mencerminkan pandangan serupa dari Ilya Sutskever, mantan peneliti OpenAI, yang menyebut industri AI telah mencapai “peak data.”
Bukan sebuah rahasia lagi bahwa, kebutuhan data yang besar menjadi tantangan utama dalam pengembangan AI. Model AI modern membutuhkan data berkualitas tinggi untuk meningkatkan akurasi dan kinerjanya. Namun, data dunia nyata, yang mencakup pengetahuan, interaksi, dan pengalaman manusia, mulai langka.
BACA JUGA:
- Peristiwa Penting yang Membuat 2024 Jadi Tahun Bersejarah untuk AI
- Susul Elon Musk, Kini Meta Minta OpenAI Berhenti Cari Profit
“Secara praktis, kita telah menghabiskan semua pengetahuan manusia untuk melatih AI,” ujar Musk. Pernyataan ini merujuk pada keterbatasan dataset yang tersedia untuk melatih model seperti chatbot Grok milik X atau model besar lainnya.
Sebagai tanggapan atas krisis data ini, Musk mengusulkan penggunaan synthetic data sebagai jalan keluar. Synthetic data adalah data yang dihasilkan oleh AI untuk melatih dirinya sendiri. Proses ini memungkinkan model AI menciptakan dataset yang lebih besar dan lebih variatif, melampaui batasan data nyata.
Industri teknologi besar, seperti Google, OpenAI, Anthropic, dan Meta, telah memanfaatkan synthetic data dalam pelatihan model mereka. Musk percaya bahwa dengan synthetic data, AI dapat melalui proses self-learning, menilai kinerjanya sendiri, dan terus meningkatkan kemampuan.
Penggunaan synthetic data memiliki beberapa keuntungan, seperti efisiensi biaya karena membuat data set baru lebih murah dibandingkan mengumpulkan data asli, diversifikasi data karena ini mampu mencakup skenario yang tidak terjadi di dunia nyatan, dan soal privasi data karena synthetic data tidak melibatkan data pribadi.
Namun, ketergantungan pada synthetic data juga memiliki risiko. Penelitian menunjukkan bahwa model yang terlalu sering dilatih menggunakan synthetic data dapat mengalami model collapse. Ini mengakibatkan penurunan kualitas model, termasuk pengurangan kreativitas, peningkatan bias, dan akurasi yang berkurang akibat data yang dihasilkan secara rekursif.
Meskipun menghadapi tantangan data, X milik Elon Muskterus memperluas aksesibilitas chatbot Grok. Sebelumnya, fitur ini hanya tersedia bagi pengguna premium X dengan biaya $8 per bulan (sekitar Rp125.000). Kini, Grok dapat diunduh secara gratis melalui aplikasi iOS. Selain sebagai chatbot, Grok juga memiliki kemampuan menghasilkan gambar.
Namun, fitur ini tidak memiliki batasan konten atau perlindungan hak kekayaan intelektual, yang berpotensi menimbulkan masalah hukum di masa depan.
Di balik semua itu, pandangan Elon Musk tentang krisis data dunia nyata menggambarkan tantangan besar yang dihadapi industri AI. Synthetic data muncul sebagai solusi inovatif, tetapi penggunaannya harus dilakukan dengan hati-hati untuk menghindari dampak negatif.
BACA JUGA:
- Elon Musk Tiba-tiba Mau Bikin Video Game Lewat Startup xAI
- Grok AI Hadirkan Generator Gambar Aurora di Twitter X
Sementara itu, langkah X untuk mengembangkan dan memperluas aksesibilitas Grok menunjukkan bagaimana perusahaan tetap berinovasi meski menghadapi keterbatasan data. Apakah synthetic data dapat sepenuhnya menggantikan data nyata dalam pelatihan AI, atau hanya menjadi solusi sementara, masih menjadi pertanyaan besar di masa depan teknologi.