Saya membandingkan pembuat gambar ChatGPT dengan Gemini untuk melihat AI mana yang menghasilkan visual paling akurat dan kreatif
ChatGPT dan Gemini dianggap sebagai generator gambar AI terbaik di luar sana. Dengan kedua model ini, Anda dapat menggambarkan suatu pemandangan dan melihatnya menjadi nyata dalam hitungan detik. Namun, tidak semua generator gambar dibuat sama .
Untuk mengetahui perbandingannya, saya memberikan kedua platform lima perintah yang sama persis — mulai dari fantasi hingga fotorealisme — dan mengevaluasi bagaimana masing-masing AI merespons dalam hal kreativitas, detail, dan seberapa baik mereka menafsirkan perintah tersebut.
Hasilnya tidak selalu sesuai dengan yang saya harapkan. Dalam beberapa kasus, satu alat jelas lebih unggul dari yang lain. Dalam kasus lain, hasilnya tergantung pada gaya dan realisme.
Beginilah kinerja masing-masing AI saat diberi tantangan yang sama — dan mana yang mungkin menjadi pilihan lebih baik untuk permintaan gambar Anda berikutnya.
Agar mudah diikuti, tata letaknya konsisten di seluruh bagian ini. Output gambar ChatGPT akan selalu muncul di sebelah kiri , dan Gemini di sebelah kanan .
Dengan cara itu, Anda dapat dengan mudah membandingkan keduanya secara berdampingan dan melihat dengan tepat bagaimana masing-masing AI menafsirkan penjelasan singkat tersebut.
Hal ini berlaku untuk semua perintah kecuali nomor dua, di mana gambar keluaran Gemini berada di bawah ChatGPT.
1. Semangkuk ramen yang tampak nyata di atas meja kayu
Untuk pertanyaan ini, saya ingin menguji hiperrealisme . Fotografi makanan terkenal sulit dipalsukan — jadi semangkuk ramen panas dengan topping yang mendetail, pencahayaan yang hangat, dan tekstur yang terlihat akan menjadi indikator kuat seberapa baik setiap AI menyajikan realitas.
Jika kedua gambar tersebut sekilas dapat dianggap sebagai foto restoran sungguhan, saya akan menyebutnya sebagai kemenangan. Saya menggunakan perintah berikut: “Buatlah gambar semangkuk ramen yang tampak nyata dengan uap yang mengepul, diletakkan di atas meja kayu pedesaan di restoran yang pencahayaannya redup.”
Kedua model ini berhasil di sini — tetapi ChatGPT menang. Gambarnya tampak benar-benar fotorealistik, hingga ke detail-detail kecil seperti uap yang mengepul dan kuah yang mengilap. Jika saya melihatnya di feed saya, saya mungkin tidak akan mempertanyakannya.
Versi Gemini, di sisi lain, tidak sepenuhnya berhasil. Telurnya tampak datar dan kurang berdimensi, dan komposisi keseluruhannya terasa kurang meyakinkan. Hasilnya tidak buruk, tetapi tidak lulus uji “apakah ini nyata?” seperti yang dilakukan ChatGPT.
2. Sepasang sepatu lari futuristik dengan latar belakang studio putih
Di sini, saya mencari hasil render produk yang bersih . Pikirkan yang siap untuk e-commerce: tepi tajam, pencahayaan studio, dan tekstur material yang realistis.
Ini adalah uji coba seberapa baik masing-masing AI dapat menghasilkan visual bergaya komersial dengan kebisingan latar belakang yang minimal. Perintahnya mungkin tampak sederhana, tetapi itulah mengapa perintah itu penting — akurasi dan presentasi adalah segalanya.
Untuk yang ini saya menggunakan: “Buat gambar sepasang sepatu lari futuristik, difoto pada latar belakang studio putih, dengan bayangan lembut dan detail reflektif.”
Saya tidak dapat memuat kedua gambar pada slide yang sama, jadi gambar Gemini ada di bawah .
Kedua AI tersebut berhasil menafsirkan perintah dengan cukup baik — tetapi Gemini unggul dalam hal ini.
Pengerjaan bayangan dan teksturnya sangat bagus, memberikan dimensi dan bobot yang nyata pada sepatu tersebut. Bahkan ada efek cahaya lembut yang menambah kesan futuristik.
Menariknya, kedua model AI menghasilkan desain yang sangat mirip dengan sepatu kets Nike yang ada, tetapi versi ChatGPT tampak lebih datar jika dibandingkan, hampir seperti rendering 2D daripada foto produk yang dipoles.
3. Kastil abad pertengahan yang melayang di langit saat matahari terbenam
Perintah ini mengarah pada pembangunan dunia fantasi — sesuatu yang Anda harapkan ada di sampul buku atau dalam set seni konsep permainan.
Ia menguji komposisi, pencahayaan, dan suasana, plus seberapa imajinatif setiap AI dalam menyusun struktur dan latar. Ini bukan sekadar mengikuti instruksi, tetapi menciptakan sesuatu yang sesuai suasana hati.
Untuk perintah membangun dunia fantasi, saya menggunakan: “Buatlah gambar kastil abad pertengahan megah yang terbuat dari batu, melayang di atas awan saat matahari terbenam, dengan pencahayaan dramatis dan kedalaman atmosfer.”
ChatGPT benar-benar berhasil membuat yang satu ini. Pencahayaannya dramatis, dengan separuh kastil diselimuti bayangan dan sisanya bersinar dalam cahaya keemasan — persis seperti kedalaman atmosfer yang saya bayangkan.
Sementara itu, Gemini bertindak terlalu literal. Kastil itu memang mengambang, tetapi bagian bawahnya tampak membingungkan — seperti tidak yakin apakah akan tercermin di awan atau berakar pada sesuatu.
Film ini sedikit mengingatkan pada “Laputa: Castle in the Sky”, yang merupakan sentuhan yang bagus, tetapi tidak terlalu berhasil.
4. Poster perjalanan bergaya vintage untuk Mars
Yang ini semuanya tentang desain grafis dan estetika gaya. Saya ingin melihat apakah setiap AI dapat menangkap tampilan dan nuansa poster perjalanan pertengahan abad — tipografi yang berani, bentuk grafis yang datar, palet warna yang terbatas, dan pilihan desain yang disengaja.
Ini bukan tentang realisme, tetapi lebih tentang kontrol artistik dan bahasa visual. Saya menguji kedua model dengan perintah berikut: “Buat poster perjalanan bergaya retro tahun 1950-an untuk Mars, dengan huruf tebal, lanskap planet merah bergaya, dan palet warna vintage.”
Yang ini nyaris sempurna, tetapi ChatGPT mengunggulinya. Versinya memiliki hasil akhir bertekstur kasar yang benar-benar menonjolkan tampilan vintage, bersama dengan tipografi bervariasi yang memberikan kesan autentik dan sesuai dengan eranya. Anda benar-benar dapat membayangkannya tergantung di pameran fiksi ilmiah retro.
Versi Gemini tidak jauh tertinggal — menggunakan palet warna yang pas dan huruf tebal — tetapi tidak memiliki karakter desain yang autentik. Rasanya lebih seperti poster yang terinspirasi oleh era tersebut, daripada sesuatu yang dibuat pada masa itu.
5. Potret editorial
Untuk menyempurnakannya, saya menginginkan sesuatu yang bergaya tetapi berakar pada realisme — jenis potret yang akan Anda lihat dalam tajuk rencana.
Perintah ini menguji kemampuan masing-masing AI untuk menampilkan fitur manusia secara akurat, sekaligus mengelola elemen visual berlapis seperti pantulan, pencahayaan, dan pergerakan di lingkungan perkotaan yang sibuk.
Untuk perintah terakhir saya menggunakan: “Buatlah potret bergaya seorang wanita di Times Square pada malam hari, mengenakan kacamata hitam reflektif yang memperlihatkan tanda neon, pencahayaan sinematik di tengah pengambilan gambar.”
Tidak diragukan lagi bahwa Gemini berhasil dalam hal ini. Potretnya beresolusi tinggi, pencahayaannya sempurna, dan penuh dengan detail. Dari tekstur kulit hingga garis luar bibir yang halus, setiap elemennya tepat sasaran.
Saya mengamati gambar itu, mencari sesuatu — apa pun — yang aneh, dan hasilnya nihil. Realismenya luar biasa, hampir setara dengan apa yang Anda harapkan dari Midjourney.
ChatGPT membawa “bergaya” ke arah yang lebih artistik — tidak buruk sama sekali, tetapi dalam hal kualitas dan presisi fotografi, hasil karya Gemini berada di liga yang berbeda.
Pikiran akhir….
Dari kelima prompt, ChatGPT menjadi yang terbaik. Output gambarnya secara konsisten kreatif, tersusun dengan baik, dan sangat sesuai dengan maksud dari setiap brief — terutama dalam hal fantasi, tekstur, dan visual bergaya.
Ia menangani permintaan artistik dengan percaya diri dan menghasilkan visual yang terasa disusun dengan saksama, bukan sekadar dibuat-buat.
Meski begitu, Gemini benar-benar mampu bertahan — dan di beberapa area, mengungguli ChatGPT. Potret hiper-realistisnya sempurna, dan menghasilkan bidikan bergaya produk dengan tekstur dan kedalaman yang lebih baik.
Ia juga memiliki satu keunggulan utama: Gemini menghasilkan gambar jauh lebih cepat daripada ChatGPT selama pengujian. Jika kecepatan dan realisme adalah prioritas Anda, Gemini layak digunakan.
Namun untuk fleksibilitas keseluruhan, interpretasi kreatif, dan polesan visual — ChatGPT merupakan generator gambar yang lebih kuat kali ini.