Alibaba Cloud Rilis LLM Gratis, Bernama Qwen-72B dan Qwen-1.8B

REKOMENDASI
ARTIKEL TERKAIT

Telset.id, Jakarta – Saat ini, Alibaba Cloud resmi mengumumkan peluncuran dari dua model bahasa besar atau yang dikenal sebagai LLM (Large Language Models) open source, bernama Qwen-72B dan Qwen-1.8B.

Sebagai informasi, Qwen 72B dan Qwen-1.8B ini merupakan versi versi 72-miliar parameter dan 1,8-miliar parameter dari model AI dasar buatan Alibaba, yaitu Tongyi Qianwen, di komunitas model AI mereka, yang bernama ModelScope, dan platform AI kolaboratif, Hugging Face.

Tidak hanya itu saja, perusahaan asal China ini juga menghadirkan lebih banyak model bahasa besar multimodal, seperti Qwen-Audio dan Qwen-Audio-Chat, versi model pemahaman audio yang sudah dilatih sebelumnya dan penyempurnaan percakapan, untuk tujuan penelitian dan komersial.

BACA JUGA:

Hingga sekarang, penyedia layanan cloud ini telah membantu untuk menyediakan berbagai ukuran LLM dengan parameter mulai dari 1,8B, 7B, 14B hingga 72B, serta LLM multimodal dengan fitur pemahaman audio dan visual.

Dari rilis resmi yang diterima Telset, Jingren Zhou CTO Alibaba Cloud mengatakan bahwa membangun ekosistem open-source adalah hal penting untuk mengembangkan LLM dan aplikasi AI.

“Kami ingin menjadi penyedia cloud paling terbuka dan membuat kemampuan AI generatif bisa digunakan oleh semua orang. Oleh sebab itu, untuk mencapai tujuan ini, kami akan terus memberikan teknologi canggih kami serta memfasilitasi pengembangan komunitas open-source bersama dengan mitra kami,” ujar Zhou.

Sebelumnya, Alibaba Cloud juga telah melakukan pelatihan yang dilakukan pada lebih dari 3 triliun token, model 72-miliar parameter ini mengungguli model-model open-source utama lainnya dalam sepuluh tolok ukur.

Salah satunya adalah tolok ukur untuk Massive Multi-task Language Understanding (MMLU) yang mengukur akurasi model multitask, bernama HumanEval yang menguji kemampuan generasi kode, dan GSM8K, dan juga tolok ukur untuk masalah aritmetika.

Untuk model Qwen-72B menjadi model yang mampu menangani berbagai perintah yang kompleks, termasuk bermain dan transfer gaya bahasa pada kemampuan LLM untuk mengambil peran atau persona tertentu dalam menghasilkan respons yang lebih relevan secara kontekstual seperti peran yang dipilih. Model  ini cocok dipakai untuk chatbot AI.

Menariknya, para perusahaan dan lembaga penelitian dapat mengakses kode model Qwen-72B, bobot model, dan dokumentasi serta menggunakannya secara gratis untuk tujuan penelitian. Tetapi untuk penggunaan komersial, model tersebut bisa gratis digunakan untuk perusahaan dengan syarat, ada pengguna bulanan aktif yang kurang dari 100 juta.

Selain itu, perusahaan ini juga mengumumkan bahwa mereka telah menyediakan secara gratis model LLM berparameter 1,8 miliar, Qwen-18B yang dapat berjalan pada edge. LLM kelas ringan ini memungkinkan inferensi pada perangkat edge dengan sumber daya komputasi terbatas, membuatnya memungkinkan untuk dipakai di perangkat seperti HP.

BACA JUGA:

Versi yang berukuran lebih kecil dengan kebutuhan sumber daya komputasi yang lebih rendah ini dapat berguna bagi seseorang yang mencari opsi yang lebih hemat biaya dan penggunaan yang lebih mudah untuk diterapkan dalam menggunakan LLM. Namun, model Qwen-1.8B saat ini hanya tersedia untuk tujuan penelitian.

22 KOMENTAR

Komentar ditutup.

ARTIKEL TEKINI
HARGA DAN SPESIFIKASI