Nvidia Dan Microsoft Sama-Sama Bertaruh, Agen AI Butuh Hardware Khusus

Add on Google

Dua raksasa teknologi, Nvidia dan Microsoft, sama-sama mengirim pesan yang mirip dalam waktu yang berdekatan: agen AI tidak lagi cukup berjalan di perangkat biasa. Keduanya kini mendorong hardware khusus, meski dengan pendekatan yang sangat berbeda.

Perbedaan itu penting karena akan memengaruhi cara perusahaan membeli perangkat, menyusun anggaran, dan merancang keamanan endpoint. Jika agen benar-benar menjadi cara kerja baru di kantor, lokasi komputasi akan menjadi keputusan strategis, bukan sekadar pilihan teknis.

Dua Jalan Untuk Satu Tujuan

Nvidia memperkenalkan RTX Spark sebagai fondasi PC Windows baru yang dibangun di sekitar asisten pribadi. Sistem ringkas ini menggabungkan CPU Arm-based Grace dan GPU Blackwell, lalu membawa hingga 128GB unified memory melalui interconnect NVLink milik Nvidia.

Perusahaan itu menyebut platform tersebut mampu menjalankan model sekitar 120 miliar parameter dengan context window hingga 1 juta token tanpa harus bolak-balik ke pusat data. Nvidia juga menyiapkan RTX Spark dalam bentuk laptop dan desktop kecil dari Asus, Dell, HP, Lenovo, Microsoft Surface, dan MSI.

Di sisi lain, Microsoft memperkenalkan Project Solara sebagai platform perangkat yang menjalankan agen alih-alih aplikasi tradisional. Solara tidak datang dengan chip baru, melainkan memakai platform software berbasis sistem operasi ringan turunan Android Open Source Project yang disebut Microsoft Device Ecosystem Platform.

Platform itu berjalan pada hardware referensi dengan chip dari Qualcomm dan MediaTek. Microsoft juga mendemonstrasikan dua konsep perangkat untuk pekerja enterprise, yaitu desk companion dan wearable badge.

Perdebatan Lama Soal Komputasi Berat

Kedua pendekatan ini memperlihatkan keyakinan yang sama, tetapi menjawab pertanyaan yang berbeda. Nvidia ingin komputasi berat tetap berlangsung secara lokal, sementara Microsoft memilih model chip-to-cloud yang memindahkan inferensi berat ke Azure.

Dalam pandangan Nvidia, perangkat adalah mesin utama yang membawa sebagian besar silikon untuk GPU kuat. Dalam pandangan Microsoft, perangkat lebih mirip pintu depan yang aman menuju kecerdasan yang berada di tempat lain.

Microsoft menonjolkan apa yang disebut sebagai just-in-time interfaces. Dalam pendekatan ini, agen membangun layar yang diperlukan untuk tugas tertentu, sehingga developer tidak perlu mendesain ulang aplikasi untuk setiap bentuk perangkat.

Pasar Yang Mulai Bergeser Ke Edge

Persaingan infrastruktur agen sejauh ini memang banyak terjadi di data center. Nvidia, Google lewat tensor processing unit Ironwood, dan AWS dengan Trainium sama-sama bersaing untuk melatih dan menjalankan model di balik sistem agentic.

RTX Spark dan Project Solara membawa persaingan itu ke edge, langsung ke perangkat yang dipakai orang. Microsoft bukan satu-satunya pemain yang mengejar platform agen, karena Google, Salesforce, dan OpenAI juga membangun pendekatan mereka sendiri.

Namun Microsoft termasuk yang paling awal berargumen bahwa agen layak mendapat perangkat khusus yang bukan ponsel dan bukan PC tradisional. Itu yang membuat Solara menarik, sekaligus masih sulit didefinisikan secara tegas.

Keraguan Yang Masih Mengiringi

Tidak semua pihak yakin hardware agen khusus benar-benar dibutuhkan. Ben Thompson dari Stratechery menilai konfigurasi ideal untuk agen lokal adalah CPU kuat yang tetap mengandalkan cloud untuk inferensi.

Dalam pandangan itu, RTX Spark mengalokasikan die space ke core GPU yang masih kalah dibandingkan data center dalam hal memori dan bandwidth. Artinya, pembeli berpotensi membayar mahal untuk tenaga lokal yang tetap lebih baik dan lebih murah jika dijalankan di cloud.

Keraguan serupa juga muncul dari desain Microsoft sendiri. Jika perangkat Solara pada akhirnya memanggil agen berbasis cloud untuk menjalankan tugas utama, hardware di meja kerja lebih mirip terminal terkelola daripada workstation AI.

Masalahnya, Solara masih sangat awal menurut pengakuan Microsoft sendiri. Program ini baru berupa pilot, sementara ketersediaan luas baru diharapkan pada akhir 2027 atau 2028.

Apa Artinya Bagi Perusahaan

Bagi pengambil keputusan, bagian yang paling berguna adalah memisahkan lapisan orkestrasi dan keamanan dari lapisan inferensi. Dua pengumuman ini kuat pada sisi pertama, tetapi masih lemah pada sisi kedua.

Keuntungan seperti konteks lokal, latensi lebih rendah, data yang tidak keluar dari gedung, dan manajemen perangkat terpusat memang konkret. Namun menjalankan model frontier di meja kerja tetap menjadi penjualan yang sulit selama cloud masih unggul untuk model terbesar.

Langkah paling realistis adalah memantau pilot, bukan hanya presentasi panggung. Jika AccuWeather, CVS Health, dan Target menunjukkan bahwa perangkat agen khusus bisa menurunkan waktu penanganan atau tingkat kesalahan dalam tugas tertentu, kategori ini bisa masuk ke pembahasan anggaran berikutnya.

Sampai bukti itu muncul, agen tampaknya akan lebih dulu mengubah cara orang memakai perangkat yang sudah ada. Hardware baru mungkin datang, tetapi jalannya masih harus dibuktikan oleh hasil pilot di dunia nyata.