Telset.id – Jika Anda mengira pelatihan model kecerdasan buatan (AI) hanya bisa dilakukan di pusat data raksasa dengan GPU canggih, bersiaplah untuk terkejut. Dua startup AI, Flower AI dan Vana, baru saja menciptakan pendekatan revolusioner dalam melatih model bahasa besar (LLM) secara terdistribusi di seluruh dunia.
Kolaborasi mereka menghasilkan model bernama Collective-1, yang dilatih menggunakan GPU tersebar di berbagai lokasi serta memanfaatkan data pribadi dan publik. Ini adalah terobosan yang berpotensi mengganggu dominasi perusahaan besar dalam pengembangan AI.
Revolusi Pelatihan AI Terdistribusi
Flower AI mengembangkan teknologi yang memungkinkan pelatihan model dilakukan di ratusan komputer yang terhubung via internet. Sementara Vana menyediakan sumber data unik, termasuk pesan pribadi dari platform seperti X, Reddit, dan Telegram.
Nic Lane, ilmuwan komputer dari University of Cambridge dan salah satu pendiri Flower AI, menjelaskan bahwa pendekatan terdistribusi ini bisa diskalakan jauh melampaui ukuran Collective-1 yang saat ini hanya memiliki 7 miliar parameter. “Kami sedang melatih model dengan 30 miliar parameter dan berencana mencapai 100 miliar parameter tahun ini,” ujarnya.
Baca Juga:
Mengubah Dinamika Kekuatan Industri AI
Pendekatan terdistribusi ini berpotensi mengubah peta kekuatan industri AI yang selama ini dikuasai perusahaan kaya dengan akses ke pusat data besar dan chip canggih. Helen Toner, pakar tata kelola AI di Center for Security and Emerging Technology, menyebut pendekatan Flower AI “menarik dan sangat relevan” untuk kompetisi dan tata kelola AI.
Teknologi ini memungkinkan perusahaan kecil, universitas, bahkan negara dengan infrastruktur terbatas untuk membangun AI canggih dengan memanfaatkan sumber daya yang tersebar. “Ini memungkinkan Anda menskalakan komputasi dengan lebih elegan daripada model pusat data,” kata Lane.
Fotokopi Digital: Teknologi Inti di Balik Terobosan
Untuk membangun Collective-1, Lane dan rekan-rekannya di Inggris dan China mengembangkan alat baru bernama Photon yang membuat pelatihan terdistribusi lebih efisien. Alat ini merupakan penyempurnaan dari pendekatan Google yang disebut DIstributed PAth COmposition (DiPaCo).
Photon telah dirilis sebagai proyek open source bulan lalu, memungkinkan siapa pun memanfaatkan pendekatan ini. “Prosesnya memang lebih lambat daripada pelatihan konvensional, tetapi lebih fleksibel,” jelas Lane.
Baca Juga:
Anna Kazlauskas, salah satu pendiri Vana, menekankan pentingnya pendekatan baru dalam pengumpulan data. “Ini pertama kalinya data yang langsung disumbangkan pengguna digunakan untuk melatih model dasar, dengan pengguna memiliki kepemilikan atas model AI yang dibuat dari data mereka,” katanya.
Mirco Musolesi dari University College London menambahkan bahwa pendekatan terdistribusi akan membuka akses ke jenis data baru, terutama di sektor sensitif seperti kesehatan dan keuangan, tanpa risiko sentralisasi data.
Dengan perkembangan ini, masa depan industri AI mungkin tidak lagi didominasi oleh segelintir perusahaan raksasa. Pendekatan terdistribusi membuka peluang bagi lebih banyak pemain untuk berkontribusi dalam pengembangan teknologi yang akan membentuk masa depan kita.