A personal journal.

Fooocus, Antarmuka Alternatif untuk Stable Diffusion

Published on: 10/01/2024 • Updated on: 14/05/2025 • 2 min read

Saya sendiri lupa kapan saya menemukan antarmuka untuk Stable Diffusion, kemungkinan dulu ketika pertama kali DALL-E diperkenalkan karena saya kurang begitu mengikuti teknologi AI ini. Padahal aslinya sih kepingin, hanya saja saya sadar diri karena hanya punya laptop biasa-biasa saja.

Minimum Requirement (PC)

Berapa sih minimal untuk bisa menjalankan program generative ai seperti ini?

Huuuge RAM, Faaast discrete VGA. Anggap saja RAM minimal adalah 16GB, dan untuk VRAM minimal adalah 6GB.

Jika kamu pernah menggunakan AUTOMATIC1111/stable-diffusion-webui, yang mana memang sangat lengkap dan fleksibel, tapi bagi pemula pasti langsung pusing dan berakhir dengan ngikut hasil pekerjaan / setting orang lain. Ya meskipun sekarang untuk instalasi cukup klik beberapa file bat (Windows).

Tapi mari kita fokus ke Fooocus.

Fooocus adalah sebuah perangkat lunak yang berbasis pada Gradio, dan merupakan hasil pemikiran ulang dari desain Stable Diffusion dan Midjourney. Fooocus memungkinkan pengguna untuk fokus pada teks dan gambar (atau bahasa kerennya prompt), tanpa perlu melakukan penyesuaian manual atau parameter teknis.

Di dalam Fooocus sudah terdapat optimisasi yang akan meningkatkan kualitas dan keragaman gambar yang dihasilkan. Jika kamu ingin membaca tentang optimasi apa saja yang terdapat di dalam Fooocus, kamu bisa membaca di sini.

Benar saja, kamu bisa asal memasukkan perintah, dan hasilnya bim-salabim jadi apik. Jarang sekali kamu akan mendapatkan hasil yang jelek atau tidak sesuai keinginan. Beberapa masalah kemungkinan adalah hasil gambar yang kurang sesuai dengan bentuk tubuh. ehm.. jari.. ehm.

Instalasi

Instalasi di Windows sangat mudah, tinggal download file zip dari laman ini, ekstrak dan jalankan run.bat. Kamu tinggal menunggu saja semua kebutuhan model yang diunduh otomatis.

Bagi kamu yang kurang beruntung memiliki komputer dengan spesifikasi seperti tadi, bisa memanfaatkan fasilitas Google Collaboratory yang didukung oleh Fooocus (setidaknya sampai saat ini).

Kemudian, bagi kamu yang ingin menambahkan model LoRA maupun Checkpoint, sangat mudah. Intinya, Fooocus sangat mudah digunakan, dan tanpa mengubah apapun, gambar yang dihasilkan sangat mumpuni untuk membuat ilustrasi di postingan ini, misalnya.

illustration of laptop showing user interface of program generative image AI like stable diffusion web ui - Fooocus Extreme Speed

Mungkin yang bisa saya sarankan adalah menggunakan model lain seperti Dreamshaper XL yang kebetulan juga mengeluarkan versi turbo, di mana kamu bisa mendapatkan gambar seperti ini hanya dengan 7 langkah saja. Hasilnya adalah gambar yang ditampilkan dalam posting ini.

Sebagai perbandingan, saya akan menggunakan DALL-E 3 yang tersedia secara gratis pada copilot milik Microsoft, tentunya dengan prompt yang sama persis. Saya akan mengambil satu saja, karena jika kita menggunakan kata kunci ilustrasi, modelnya juga seperti itu.

illustration of laptop showing user interface of program generative image AI like stable diffusion

Jika kamu ingin mencobanya, silahkan langsung menggunakan browser Edge anda.

{{< callout emoji=โ€œ๐Ÿ’กโ€ >}}

Kamu juga bisa menggunakan Stable Diffusion ini untuk keperluan menghapus watermark, namun tentunya hasilnya adalah imajinasi AI dan bukan hasil aslinya. Namun tetap saja OK!

{{< /callout >}}

Sekarang yang saya harapkan adalah semoga Google Colab tidak membatasi ini (seperti skrip stable diffusion lain), jadi saya tetap bisa membuat gambar dengan AI secara gratis dan tanpa batas.