Pengembangan perangkat lunak dengan kecerdasan buatan (AI) semakin menarik perhatian berbagai kalangan di industri teknologi. Tim riset AI bernama Cursor menggelar eksperimen besar dengan melibatkan ratusan bot pengkodean otonom yang diberi tugas membangun browser web dari awal. Namun, hasil eksperimen ini menunjukkan bahwa meskipun AI mampu menghasilkan kode dalam jumlah besar, bot-bot tersebut gagal menembus milestone penting dalam menghasilkan browser yang fungsional.
Eksperimen ini bertujuan menguji apakah AI dapat secara mandiri mengembangkan software kompleks tanpa campur tangan manusia. Dalam kurun waktu hanya satu minggu, ratusan agen AI yang bekerja masing-masing bertanggung jawab membuat komponen seperti HTML parser, CSS parser, dan rendering engine. Kebebasan penuh yang diberikan justru menimbulkan masalah besar dalam hal sinkronisasi dan pembagian tugas antar agen AI.
Hambatan Besar dalam Koordinasi Agen AI
Salah satu kendala utama yang muncul adalah konflik file-locking, di mana beberapa agen AI mencoba mengakses dan memperbarui file yang sama secara simultan. Kondisi ini menyebabkan gangguan dan jeda berulang dalam proses pengkodean. Selain itu, eksperimen mengungkap adanya duplikasi kerja, karena agen-agen AI mengerjakan tugas yang sama tanpa koordinasi efektif.
Masalah lain yang ditemukan yaitu agen-agen cenderung menghindari tugas ambigu atau sulit sehingga bagian kritis dari proyek tidak tersentuh dengan baik. Hal ini merefleksikan keterbatasan AI dalam mengelola kolaborasi secara otonom untuk proyek perangkat lunak berukuran besar dan kompleks. Dengan demikian, eksperimen ini menyoroti tantangan signifikan dalam mengandalkan agen AI tanpa struktur manajemen yang memadai.
Penerapan Sistem Manajemen Tugas Berhierarki
Untuk mengatasi ketidakefisienan yang terjadi, tim Cursor mengimplementasikan sistem manajemen tugas berbasis hirarki. Mereka membagi peran agen AI ke dalam tiga kategori kunci:
- Planner (Perencana): Memecah proyek besar menjadi bagian-bagian kecil dan mendistribusikan tugas kepada agen pekerja.
- Worker (Pekerja): Menyelesaikan tugas yang diberikan oleh planner.
- Judge (Penilai): Mengevaluasi kualitas dan akurasi hasil kerja para pekerja.
Meski struktur baru ini berhasil memperbaiki koordinasi dan mengurangi duplikasi tugas, perbaikan tersebut tidak sepenuhnya menyelesaikan semua masalah. Pada akhir proyek, AI menghasilkan lebih dari satu juta baris kode yang tersebar di sekitar seribu file. Namun, sebagian besar kode tersebut mengandung error, inkonsistensi, dan tidak memenuhi standar fungsi dasar sebuah browser.
Ketergantungan pada Pustaka Open Source Membatasi Orisinalitas
Salah satu kritik tajam terhadap proyek ini adalah tingginya ketergantungan pada pustaka open source yang sudah ada, seperti Servo dan QuickJS. Hal ini menimbulkan keraguan terhadap orisinalitas dan kontribusi agen AI dalam membangun komponen inti browser. Kode yang dihasilkan juga memiliki desain yang tidak modular, sulit dikembangkan, serta tidak sesuai standar industri.
Kondisi tersebut membuat produk akhir AI tidak kompatibel dengan kebutuhan nyata pengoperasian browser yang handal. Dengan demikian, proyek ini memperlihatkan bahwa tanpa pondasi desain yang matang, AI kesulitan menciptakan arsitektur perangkat lunak terpadu dan berkualitas tinggi secara mandiri.
Biaya dan Sumber Daya yang Sangat Tinggi
Selain masalah teknis, eksperimen ini juga membutuhkan investasi finansial besar, mencapai antara $3 juta hingga $5 juta hanya untuk kebutuhan infrastruktur komputasi serta pemrosesan data. Angka ini mencerminkan tingginya biaya operasional menjalankan sistem AI yang konstan dalam skala besar.
Investasi besar tersebut membuktikan bahwa meskipun AI mampu memproduksi kode dalam jumlah masif, pengawasan manusia dan dukungan sumber daya masih sangat diperlukan. Dari segi skalabilitas dan efisiensi biaya, AI mandiri saat ini belum mampu mengambil alih seluruh fungsi manusia dalam pengembangan perangkat lunak kompleks seperti browser web.
Pelajaran Berharga dari Eksperimen AI Cursor
Beberapa poin penting yang dapat diambil dari eksperimen ini antara lain:
- AI dapat menghasilkan kode berjumlah besar, tetapi kualitasnya cenderung rendah tanpa pengarahan manusia yang memadai.
- Peran manusia tetap sangat krusial dalam mengawasi, membimbing, dan mengintegrasikan hasil kerja agen AI.
- AI lebih efektif jika difungsikan sebagai alat bantu pengembang manusia, bukan sebagai pengganti total tenaga manusia.
Eksperimen ambisius yang dilakukan Cursor ini memperlihatkan dua sisi yang berlawanan: kemajuan teknologi AI sekaligus hambatan dalam penerapannya pada perangkat lunak kompleks. Keberhasilan proyek teknologi seperti pembuatan browser web masih sangat bergantung pada kolaborasi manusia dan mesin.
Studi yang dihasilkan memberikan gambaran jelas mengenai keterbatasan AI saat ini dalam bidang rekayasa perangkat lunak. Ini menegaskan bahwa di masa depan, peran manusia dalam pengembangan software tetap sangat vital dan tidak bisa digantikan sepenuhnya oleh AI.





