George Hotz, peretas yang dulu membobol iPhone saat berusia 17 tahun, kini melontarkan peringatan keras tentang AI coding agents. Dalam tulisannya, ia menilai adopsi massal alat pemrograman berbasis AI bisa menjadi salah satu kesalahan paling mahal dalam sejarah perangkat lunak.
Hotz tidak berbicara dari teori semata. Ia mengaku telah memakai agent selama enam bulan untuk proyek nyata, termasuk bagian dari Tinygrad dan reverse-engineering penuh firmware chip USB-PCIe.
Kecepatan awal yang menipu
Menurut Hotz, masalah terbesar bukan pada dorongan produktivitas di awal. Ia mengakui agent memang bisa mempercepat progres di bagian depan, tetapi pekerjaan penting sering kembali ke manusia untuk memperbaiki hasilnya.
Ia melihat output AI coding agent kerap tampak rusak, tetapi kerusakannya makin sulit dideteksi. Pola itu, menurut dia, sejalan dengan model statistik yang makin akurat tetapi tetap tidak benar-benar memahami program.
Hotz juga menolak anggapan bahwa kritiknya lahir dari ego programmer yang takut digantikan alat. Baginya, inti persoalan justru terletak pada kualitas kerja yang mulai tergerus secara sistematis.
Risiko ketika dipakai massal
Hotz menilai bahaya terbesar muncul saat terlalu banyak orang memakai agent sekaligus di dalam organisasi. Ia melihat dorongan perusahaan teknologi besar dan Wall Street untuk mengadopsi alat ini secara luas justru dapat mempercepat turunnya rata-rata kualitas kode.
Ia menggambarkan kondisi itu sebagai lingkungan yang menghasilkan lebih banyak output, tetapi bukan lebih banyak kualitas. Dalam pandangannya, dunia perangkat lunak bisa masuk ke “golden era for buckets and buckets of slop, and a dark age for gems of quality.”
Sebagai contoh, ia menyorot laporan bahwa Apple mendorong alat coding AI ke seluruh organisasi rekayasanya. Dari situ, Hotz mempertanyakan arah kualitas macOS dalam dua tahun ke depan.
Masalah ada pada cara kerja tim
Argumen Hotz juga bersifat struktural. Ia menilai pekerja berprestasi tinggi punya umpan balik yang cukup rapat untuk menangkap kesalahan agent sebelum kode dikirim.
Sebaliknya, pekerja dengan performa lebih rendah tidak punya mekanisme pemeriksaan diri yang sama. Jika kelompok ini memakai agent untuk menghasilkan output 10 kali lebih banyak, hasil akhirnya justru bisa berupa degradasi kualitas yang lebih cepat dan tertutup volume kerja.
Hotz bahkan membandingkan situasi ini dengan alat lain yang juga bisa menemukan bug, tetapi tidak memicu kekhawatiran serupa. Ia menyebut Google’s AFL mampu menemukan lebih banyak bug daripada LLM, namun tidak memunculkan perdebatan yang sama soal harga diri.
Perdebatan lama yang kembali panas
Posisi Hotz kini berada di kubu skeptis yang juga diisi Yann LeCun dari Meta dan Gary Marcus. Menurut pandangan itu, language model memang bisa meniru distribusi kode yang sudah ada, tetapi belum mampu menalar masalah baru dari prinsip pertama.
Di sisi lain, arah industri justru bergerak cepat ke model kerja yang makin agentik. Vibe coding, yakni memberi instruksi dalam bahasa sehari-hari lalu membiarkan AI membangun implementasinya, meledak selama setahun terakhir.
Microsoft juga mengubah GitHub Copilot menjadi sistem agentik penuh pada 2025. CEO Satya Nadella menyebut langkah itu sebagai pergeseran tingkat platform yang sebanding dengan perpindahan ke cloud.
Kubu pro-agent mulai bergeser
Penolakan Hotz muncul saat sejumlah tokoh besar justru bergerak ke arah yang lebih optimistis. Andrej Karpathy, salah satu peneliti AI paling menonjol, sempat skeptis terhadap agent lebih awal pada 2025 tetapi kemudian berubah sikap setelah rilis model baru.
Karpathy bergabung ke tim pre-training Anthropic pada 19 Mei dan menyebut beberapa tahun ke depan di garis depan AI sebagai periode yang “especially formative.” Pergeseran itu menambah bobot pada debat yang belum menemukan titik temu.
Anthropic sendiri melihat perubahan perilaku di internalnya. CEO Dario Amodei mengatakan di Davos bahwa sebagian engineer Anthropic sudah berhenti menulis kode sendiri dan membiarkan model mengerjakannya, lalu mereka meninjau hasilnya.
Hotz mengaku pernah mencoba pola kerja serupa, tetapi tetap kembali ke perbaikan manual. Bagi dia, itu menjadi tanda paling jelas bahwa AI coding agent belum siap menjadi tulang punggung pengembangan perangkat lunak skala besar.
