Telset.id, Jakarta – Meta mengungkapkan sedang membuat terobosan model bahasa chatbot AI terbaru dengan proyek Massively Multilingual Speech (MMS), yang membedakannya dari tiruan ChatGPT biasa.
Proyek multilingual speech mewakili kemajuan signifikan dalam teknologi bahasa dan mempromosikan keberagaman linguistik global, terutama sejak kehadiran teknologi AI.
Proyek-proyek ini menggunakan model bahasa AI untuk mengenali dan menghasilkan ucapan dalam berbagai bahasa, seringkali meliputi ribuan latar belakang linguistik yang beragam.
Dengan memanfaatkan pendekatan inovatif, seperti menggabungkan sumber data yang tidak konvensional atau menggunakan pembelajaran representasi ucapan sendiri, proyek multilingual speech bertujuan untuk mengatasi batasan dan memberdayakan individu untuk berkomunikasi, belajar, dan mengakses informasi dalam bahasa ibu mereka.
BACA JUGA:
- Meta Kembangkan Chip AI “MTIA” untuk Memperkuat Metaverse
- Demi Lawan Apple, Meta Mau Ambil Teknologi AR Magic Leap
Massively Multilingual Speech (MMS)
Meta telah mengungkapkan prestasi terbaru dalam model bahasa AI dengan proyek terobosan Massively Multilingual Speech (MMS), yang membedakannya dari tiruan ChatGPT biasa.
Dalam langkah inovatif yang belum pernah terjadi sebelumnya, MMS dari Meta memiliki kemampuan untuk mengenali dan menghasilkan ucapan dalam lebih dari 4.000 bahasa lisan, melampaui kemampuan pendahulunya.
Tidak puas hanya dengan menyimpan terobosan ini sebagai rahasia, Meta telah memutuskan untuk menghadirkan MMS sebagai open-source, mengundang para peneliti untuk memanfaatkan dan memperluas fondasi yang ada.
Dengan begitu, seperti dikutip Telset dari Gizmochina, Meta berharap dapat membantu pelestarian keberagaman bahasa dan mendorong kemajuan kolaboratif di bidang ini.
Model pengenalan ucapan tradisional dan teks-ke-ucapan memerlukan pelatihan yang intensif dengan menggunakan dataset audio yang luas, dilengkapi dengan label transkripsi yang cermat untuk memfasilitasi algoritma pembelajaran mesin.
Namun, banyak bahasa terancam punah, terutama yang ditemukan di luar negara-negara industrialis, tidak memiliki data yang komprehensif seperti itu, sehingga berisiko hilang sama sekali.
Menyadari situasi ini, Meta mengadopsi pendekatan cerdik dengan memanfaatkan teks-teks agama yang diterjemahkan. Teks-teks ini, seperti Alkitab, menawarkan variasi linguistik yang beragam yang telah melalui pemeriksaan intensif untuk penelitian terjemahan bahasa berbasis teks.
Dengan menggunakan model wav2vec 2.0 untuk pembelajaran representasi ucapan sendiri, Meta lebih lanjut memperbaiki kegunaan data dengan melatih model perpaduan. Sinergi antara sumber data yang tidak biasa dan pemodelan ucapan yang mandiri menghasilkan hasil yang luar biasa.
Evaluasi komparatif terhadap Whisper dari OpenAI mengungkapkan keunggulan MMS, mencapai penurunan tingkat kesalahan kata sebesar 50% sambil melampaui cakupan bahasa Whisper dengan faktor 11 yang mengejutkan.
BACA JUGA:
- Meta Rekrut Tim Pengembang Jaringan AI dari Graphcore
- Canggih! Model AI Buatan Meta Ini Gak Perlu Dilatih
Dengan merilis MMS sebagai proyek riset open-source, Meta bermaksud untuk membalikkan tren yang mengkhawatirkan di mana teknologi mengikis keberagaman linguistik, yang sering kali membatasi dukungan hanya pada 100 bahasa paling umum yang disukai oleh perusahaan teknologi.
Meta membayangkan sebuah dunia di mana teknologi bantu, teks-ke-ucapan, dan bahkan teknologi realitas virtual dan augmented memungkinkan individu untuk berkomunikasi dan belajar dalam bahasa ibu mereka.
Dengan demikian, Meta berharap menginspirasi pelestarian dan keberlanjutan bahasa-bahasa di seluruh dunia. Jika dilihat ini proyek yang sangat menarik, semoga akan bermanfaat. [HBS]