Beberapa minggu lalu, sebuah video melintas di timeline-ku seorang mahasiswa di China berhasil mendapatkan pendanaan besar setelah menciptakan mesin prediksi simulasi. Melihat itu, jiwaku terpanggil untuk mengaplikasikan ide serupa di dunia nyata, khususnya untuk konteks Indonesia. Tapi ya, ternyata perjalanannya tidak semudah membalikkan telapak tangan—atau sekadar "memperbudak" AI demi hasil instan.
Perjalanan VoxSwarm
Jujur saja, nama ini saran dari ChatGPT, wkwkwk. Tapi, aku tidak asal ambil. Setelah mempertimbangkan mimpi besar di balik sistem ini, nama VoxSwarm kayaknya sangat pas. Secara filosofis, ia bermakna "ribuan suara kecil yang saling berbisik, lalu perlahan menyatu menjadi sebuah arah." Puitis sedikit bolehlah, ya?
Lahirlah ide ambisius ini
VoxSwarm lahir dari tumpukan referensi yang muncul di akun kedua media sosialku. Berawal dari inspirasi di GitHub dan diskusi dengan kawan-kawan AI, riset singkat ini pun berubah menjadi sebuah proyek nyata.
Malam-malamku habis untuk membongkar segala sumber daya AI yang ada. Aku mulai melakukan riset mendalam, mempelajari cara kerja sistem serupa, hingga membedah berbagai website referensi. Langkah demi langkah, aku mulai menyusun diagram alur untuk menentukan akan jadi seperti apa "anak didikku" ini nantinya.
Bergerak sedikit demi sedikit
"Bergerak sedikit demi sedikit" mungkin adalah kalimat yang paling tepat. Aku memulai proyek ini dari titik nol: belajar. Tidak tanggung-tanggung, aku membuka kembali materi kuliah Machine Learning, Data Mining, hingga mencari referensi di internet agar punya pandangan yang luas. Applause khusus untuk Gemini Deep Research yang sudah menemaniku begadang buat belajar, wkwkwk.
BOSOKKK
Begitu ide terkumpul, aku langsung tancap gas. Aku mencoba download Ollama untuk menjalankan model LLM sebagai otak sistem ini. Namun, realita menghantam keras: laptop "butut"-ku tidak sanggup memikul beban seberat itu. Eksperimen pertama berantakan, hasilnya ngeleg lama, dan jujur wes dontol buanget.
Pantang mundur dari kata gratis
Karena keterbatasan hardware, aku putar otak dan pindah ke platform Groq. Dengan model berparameter 70b, aku sempat ngerasa di atas angin. Tapi lagi-lagi, kurangnya pengalaman ngebuatku gigit tangan aowkwowk. Hasilnya tetap tidak sesuai ekspektasi. BOSOK BUANGET!
Riset terus berlanjut. Berkat bantuan "roasting" dari berbagai AI, aku menemukan ide-ide baru, seperti menambahkan fitur analisa sentimen dan simulasi interaksi ala Twitter.
Di versi ini, aku mulai memisahkan model LLM agar penggunaan token tidak terlalu boros. Namun, masalah baru muncul: sistem terasa berat dan laggy. Ternyata, aku melakukan kesalahan amatir—semua fungsi menumpuk di satu file raksasa! Sebagai mahasiswa informatika, aku merasa sedikit berdosa melupakan prinsip dasar manajemen kode. Akhirnya, aku memutuskan untuk melakukan refaktor besar-besaran untuk persiapan Versi 3.
Setelah berjibaku dengan bug dan pemisahan file di versi sebelumnya, VoxSwarm akhirnya punya "ruh" yang sebenarnya: Machine Learning. Riset yang melelahkan akhirnya membuahkan hasil; aku berhasil mengintegrasikan model ML ke dalam sistem.
Ya, meskipun masih ada drama seperti confusion matrix yang ngaco gara-gara cuma dilatih pakai 9 data (wkwkwk), setidaknya fiturnya sudah berjalan. Ke depannya, fokus utamaku adalah upgrading besar-besaran dan mencari rekan kolaborasi agar VoxSwarm semakin tangguh.
Buat kalian yang penasaran atau ingin bantu-bantu, langsung saja cek GitHub-ku ya. Proyek ini open source, jadi silakan di-oprek dan jangan lupa kasih star-nya! See you soon!