📑 Daftar Isi

Ilustrasi server AI Huawei Atlas 800 dengan logo Ascend dan MiniMax M2.7

Huawei Ascend 0 Day Dukung Model MiniMax M2.7 untuk Inferensi

Penulis:Nur Hamzah
Terbit:
Diperbarui:
⏱️3 menit membaca
Bagikan:

Telset.id – Huawei Ascent AI mengumumkan dukungan 0 Day untuk model kecerdasan buatan terbaru, MiniMax M2.7, yang baru saja dirilis sebagai model open source pertama hasil iterasi mandiri MiniMax. Dukungan penuh untuk inferensi dan deployment model ini tersedia di platform hardware Atlas 800 seri A3 dan A2 mulai 12 April 2026.

Menurut pengumuman resmi di akun publik Ascend AI Developer, dukungan teknis telah disiapkan bersamaan dengan perilisan model. Ascend AI menyediakan dukungan penuh untuk deployment model M2.7 berbasis vllm Ascend pada produk server AI Atlas 800 A3 dan Atlas 800I A2.

MiniMax M2.7 diklaim mampu membangun Agent Harness yang kompleks secara mandiri. Model ini memanfaatkan kemampuan seperti Agent Teams, Skills kompleks, dan Tool Search Tool untuk menyelesaikan tugas-tugas produktivitas dengan tingkat kompleksitas tinggi.

Dukungan Teknis dan Optimasi Kinerja

Ascend melakukan serangkaian inovasi pada level perangkat lunak dan keras untuk mengakselerasi performa MiniMax M2.7. Inovasi mencakup adaptasi terhadap fitur FlashComm sequence partitioning model, penggantian AllReduce dengan ReduceScatter dan AllGather untuk akselerasi komunikasi, serta pengoptimalan mendalam pada operator Transformer Attention dan operator fusion MoE.

Optimasi ini bertujuan menghilangkan overhead pembacaan/penulisan tensor intermediate dan penjadwalan multi-operator. Pada skenario konkurensi DP multi, platform juga menerapkan load balancing adaptif pada domain DP, yang secara signifikan mengurangi interupsi proses decode oleh prefill dan meningkatkan throughput pada kondisi beban puncak.

Kemampuan dan Aplikasi Model

Dalam proses pengembangannya, tim MiniMax menggunakan versi awal M2 sebagai Agent Harness penelitian untuk berpartisipasi dalam siklus iterasi model generasi berikutnya. Agent ini mampu berinteraksi dan berkolaborasi dengan berbagai kelompok proyek penelitian. Peneliti hanya perlu melakukan intervensi pada keputusan dan diskusi kritis, sementara model bertanggung jawab atas konstruksi di setiap lapisan. Pendekatan berbasis Agent ini dilaporkan mempercepat penemuan masalah dan iterasi eksperimen.

Pada beberapa skenario Reinforcement Learning (RL), M2.7 diklaim mampu menangani 30-50% alur kerja. Di bidang rekayasa perangkat lunak, model ini mengasah kemampuan pemrograman yang dibutuhkan dalam skenario nyata, mencakup analisis log dan pelacakan bug, refactoring kode, keamanan kode, machine learning, serta pengembangan Android.

Dalam benchmark SWE-Pro yang mencakup berbagai bahasa pemrograman, M2.7 mencapai tingkat akurasi 56.22%, setara dengan GPT-5.3-Codex. Pada skenario yang lebih mendekati rekayasa nyata seperti SWE Multilingual (skor 76.5) dan Multi SWE Bench (skor 52.7), model ini menunjukkan keunggulan yang lebih signifikan.

Di bidang perkantoran profesional, M2.7 meningkatkan kemampuan pengetahuan khusus dan penyelesaian tugas, meraih skor tertinggi di antara model open source pada GDPval-AA. Model ini juga memiliki kemampuan berinteraksi dengan lingkungan kompleks, mempertahankan tingkat kepatuhan skills sebesar 97% pada 40 kasus yang melibatkan skills kompleks (lebih dari 2000 Token).

Untuk bidang hiburan interaktif, M2.7 membangun sistem interaksi Agent bernama OpenRoom. Sistem ini menempatkan interaksi AI dalam ruang Web GUI di mana segala elemen dapat berinteraksi, secara drastis meningkatkan kemampuan menjaga karakter dan dialog. Sistem ini dirancang untuk terus berevolusi seiring peningkatan kemampuan Agentic model dan kontribusi komunitas.

Dukungan 0 Day dari ekosistem Ascend ini memungkinkan pengembang dan pengguna langsung memanfaatkan kemampuan terbaru MiniMax M2.7 untuk berbagai aplikasi AI yang kompleks.