Xiaomi Tancap Gas di AI, MiMo-V2.5-Pro UltraSpeed Janjikan 1.000 Token per Detik

Add on Google

Xiaomi kembali menarik perhatian pasar kecerdasan buatan lewat mode UltraSpeed untuk MiMo-V2.5-Pro. Klaim yang paling menonjol adalah kecepatan keluaran lebih dari 1.000 token per detik.

Angka itu membuat MiMo-V2.5-Pro UltraSpeed masuk ke level baru dalam persaingan model AI. Xiaomi menegaskan, kompetisi sekarang bukan hanya soal besar model, tetapi juga seberapa efisien inferensi bisa dijalankan.

Model 1 triliun parameter yang dikejar efisiensi

Xiaomi menyebut MiMo-V2.5-Pro UltraSpeed dibangun di atas model berukuran 1 triliun parameter. Meski skalanya besar, model ini dioptimalkan agar tetap dapat berjalan pada GPU serbaguna.

Perusahaan mengatakan lonjakan performa tidak hanya datang dari ukuran model. Peningkatan juga berasal dari integrasi yang lebih dalam antara arsitektur model dan sistem inferensi yang mendasarinya.

Kolaborasi dengan TileRT

Percepatan itu lahir dari kolaborasi dengan TileRT. Xiaomi menjelaskan pendekatan ini mengandalkan desain bersama antara model AI dan sistem inferensi agar respons tetap cepat.

Strategi tersebut disebut sebagai salah satu implementasi co-design paling mutakhir pada platform AI Xiaomi. Tujuannya menjaga model berparameter besar tetap responsif tanpa perlu infrastruktur yang terlalu khusus.

Jauh melampaui generasi sebelumnya

Kecepatan lebih dari 1.000 token per detik menjadi lompatan besar dari generasi sebelumnya. Xiaomi membandingkannya dengan MiMo-V2-Flash yang diperkenalkan pada Desember 2025.

Saat itu, MiMo-V2-Flash mampu menghasilkan sekitar 150 token per detik. Xiaomi menyebut angka itu sudah tergolong sangat cepat karena setara dengan sekitar 110 kata per detik.

Dengan UltraSpeed, Xiaomi mengklaim pengalaman output bisa mencapai 10 kali lebih cepat dibanding layanan API standar MiMo-V2.5-Pro. Klaim ini menjadi salah satu daya tarik utama mode baru tersebut.

Biaya akses naik, uji coba dibatasi

Di balik performa yang lebih tinggi, Xiaomi menetapkan harga akses UltraSpeed sekitar tiga kali lebih mahal dibanding versi reguler. Untuk layanan standar MiMo-V2.5-Pro, biaya yang disebutkan adalah 0,025 yuan per juta token untuk cache hit, 3 yuan per juta token untuk input cache miss, dan 6 yuan per juta token untuk output.

Fitur Token Package tidak tersedia untuk mode UltraSpeed karena statusnya masih uji coba API. Xiaomi menilai biaya yang lebih tinggi sepadan dengan peningkatan kecepatan respons bagi pengguna yang memang membutuhkan output sangat cepat.

Program uji coba terbatas dibuka pada 9 Juni hingga 23 Juni 2026. Seleksi dilakukan lewat sistem aplikasi, dan prioritas diberikan kepada perusahaan serta pengembang profesional yang punya kebutuhan bisnis nyata terhadap layanan AI berkecepatan tinggi.

Peserta yang lolos mendapat akses gratis selama dua minggu untuk mencoba MiMo UltraSpeed. Selama masa uji coba, setiap akun hanya mendapat maksimal 10 entri antrian per hari, durasi sesi dibatasi 30 menit, dan sumber daya otomatis dilepas jika tidak ada aktivitas lebih dari 5 menit.

Langkah baru dalam ekspansi AI Xiaomi

MiMo-V2.5-Pro pertama kali diperkenalkan pada April 2026 sebagai bagian dari ekspansi besar Xiaomi di bidang kecerdasan buatan. Kini, keluarga MiMo telah berkembang mencakup pemrosesan teks, suara, hingga kemampuan multimodal.

Dengan mode UltraSpeed, Xiaomi memperlihatkan ambisinya untuk bersaing lebih serius di pasar model AI generatif global. Jika klaim performanya terbukti dalam penggunaan nyata, MiMo-V2.5-Pro UltraSpeed bisa menjadi salah satu solusi AI tercepat untuk pengembangan aplikasi dan layanan berbasis kecerdasan buatan.