Xiaomi Punya AI yang Lari Jauh Lebih Cepat dari ChatGPT dan Claude

Xiaomi kembali menyita perhatian lewat model AI barunya, MiMo-V2.5-Pro-UltraSpeed. Model ini diklaim mampu menghasilkan lebih dari 1.000 token per detik, angka yang jauh melampaui banyak chatbot AI populer di pasaran.

Dalam pengujian yang dikutip Decrypt, kecepatannya bahkan sempat mendekati 1.200 token per detik. Capaian itu membuat Xiaomi disebut menghadirkan salah satu sistem AI tercepat yang pernah dipublikasikan ke pasar pengembang.

Jaraknya sangat jauh dari chatbot populer

Token adalah potongan teks yang diproses AI saat membaca atau menyusun jawaban. Semakin banyak token yang diproses per detik, semakin singkat waktu respons yang diterima pengguna.

Data Artificial Analysis menunjukkan selisih yang lebar antara MiMo dan model populer lain. GPT-5.5 yang digunakan banyak pengguna ChatGPT berada di kisaran 68 token per detik, Claude Opus 4.6 sekitar 71 token per detik, sedangkan Gemini Flash mencapai kurang lebih 192 token per detik.

Perbandingan itu membuat klaim Xiaomi menonjol, bukan hanya karena angka kecepatannya, tetapi juga karena jaraknya yang sangat jauh dari model AI komersial yang sudah dikenal luas. Performa tersebut langsung menarik perhatian komunitas teknologi.

Tidak memakai chip khusus

Yang membuat pencapaian ini semakin menarik adalah pendekatan yang dipilih Xiaomi. Perusahaan itu tidak memakai perangkat keras khusus yang mahal, melainkan hanya satu server standar berisi delapan GPU.

Pendekatan ini berbeda dari perusahaan seperti Cerebras dan Groq yang mengandalkan chip khusus untuk mengejar kecepatan AI. Xiaomi justru memaksimalkan efisiensi lewat optimasi perangkat lunak, termasuk sistem TileRT dan sejumlah teknik kompresi data.

Salah satu teknik yang dipakai adalah FP4 Quantization. Metode ini mengecilkan sebagian data model agar kebutuhan memori turun dan proses berjalan lebih cepat, tanpa menurunkan kualitas jawaban secara signifikan.

Cara Xiaomi mempercepat respons AI

Xiaomi juga menggunakan teknologi DFlash untuk mempercepat pembuatan respons. Teknologi ini memungkinkan AI memprediksi dan memproses beberapa kata sekaligus dalam satu langkah, sehingga waktu yang dibutuhkan untuk menyusun jawaban menjadi lebih singkat.

Kombinasi teknologi tersebut disebut membuat model AI berukuran lebih dari satu triliun parameter tetap berjalan sangat cepat. Parameter adalah angka internal yang membantu AI mengenali pola dan menghasilkan respons, dan jumlah parameter yang besar biasanya berkaitan dengan kemampuan model yang lebih canggih.

MiMo-V2.5-Pro disebut bukan versi yang diperkecil demi kecepatan. Model ini tetap diklaim memiliki kemampuan setara model AI kelas atas dan disebut mampu bersaing dengan Claude Opus dalam berbagai pengujian coding.

Peluang penggunaan yang lebih luas

Kecepatan tinggi seperti ini membuka peluang penggunaan yang lebih luas di berbagai bidang. Beberapa contoh yang disebutkan mencakup analisis data real-time, deteksi penipuan, sistem perdagangan otomatis, hingga agen AI yang bisa berpikir dan bertindak lebih cepat.

Untuk saat ini, Xiaomi telah membuka program uji coba API MiMo-V2.5-Pro-UltraSpeed bagi pengembang dan perusahaan. Sebagian teknologi yang dipakai juga sudah dirilis secara open source, sehingga komunitas pengembang di berbagai negara bisa ikut menguji dan mempelajarinya.

Langkah tersebut menunjukkan Xiaomi tidak hanya ingin bersaing lewat perangkat konsumen, tetapi juga mulai membangun posisi di arena AI yang semakin kompetitif. Dengan performa yang diklaim melampaui ChatGPT dan Claude dalam hal kecepatan, MiMo-V2.5-Pro-UltraSpeed kini menjadi salah satu model yang paling banyak diperhatikan di ranah AI generatif.

Source: teknologi.bisnis.com

Terkait