Który AI jest najlepszy do obrazów?

Artykuł napisany w 2025. Może już być lekko nieaktualny!

Porównajmy Midjourney 7 vs Ideogram 3 vs Google Image Gen 3 vs Flux 1.1 vs ChatGPT. Który z tych generatorów obrazów jest najlepszy dla grafika. Ranking będzie subiektywny i według moich punktów kluczowych, ale postaram się wyrównać pole gry i wycisnąć najlepsze z każdej technologii. Poza tym każdy może ocenić na swój sposób :)

Dlaczego brakuje Adobe Firefly i Freepik? Ponieważ nic nowego nie dodali od ostatniego mojego testu. Zobacz porównanie z 2024 lub zrób quiz AI generatorów.

Obrazy będą w losowej kolejności w karuzelach.
W rankingu biorę pod uwagę:

Trzymanie się prompta,
Estetykę i "ładność" zdjęcia,
Czy o to mi chodziło (Czy obraz jest zbliżony do tego co sobie wyobrażałem)

Puszczam prompt tylko raz. Nie poprawiam prompta, nie ulepszam, jedynie ustawiam aspect ratio na 4:5. Chcę być fair.

Kategoria Fashion

Prompt

A high-fashion model with striking features, wearing avant-garde clothing against a minimalist studio background. Perfect lighting highlighting bone structure, dramatic shadows, professional portrait composition with shallow depth of field.

Porównanie AI obrazów ideogram - fashion

Porównanie AI obrazów Midjourney 7 - fashion

Porównanie AI obrazów Google Image Gen - fashion

Tutaj szukałem czegoś z emocjami, czegoś nieco dziwnego. Flux, moim zdaniem, wypadł najgorzej. Pani pokazuje dość... dużo :P Flux jest zbyt gładki i plastikowy. Ideogram ma mniej doskonałą panią (bardziej naturalną?), ale coś mi w tym nie pasuje. Podobnie GPT - jest to świetne zdjęcie, ale czegoś mi brakuje. Dla mnie wygrywają Midjourney oraz Google Image Generator.

Moja Topka: Midjourney 7 i Google Image gen 3
Zrób quiz, znajdź Twój ulubiony generator

Kategoria Plakat (tekst)

Prompt

Vintage-style travel poster of a mountain landscape at sunset with warm orange and purple hues. Bold text at the bottom reads "ADVENTURE AWAITS" in an elegant serif font.

Jeżeli chodzi o dobór fontów, wydaje mi się, że Flux i GPT wybrały najfajniejsze szeryfowe fonty. Podobają mi się ozdobniki w wersji od Google. Całość plakatu - najmniej podobają mi się Google i Ideogram. Są takie zbyt clipartowe, wektorowe. Za mało tego vintage vibe. Flux jest zbyt plastikowy, ale ma taki vibe D&D lub okładki ze starej książki Tolkiena. Midjourney to mocna średniawka. Tekst pasuje, ale miał być szeryfowy, jest to ładna ilustracja, ale nie porywa. GPT zrobił bardzo fajną ilustrację, troszeczkę za dużo się dzieje jak dla mnie, ale mimo tego wygrywa.

Moja Topka: ChatGPT/Sora
Zrób quiz, znajdź Twój ulubiony generator

Kategoria Warzywa

Prompt

A vibrant farmers market display of fresh vegetables arranged artistically on a rustic wooden table: deep purple eggplants, bright red bell peppers, leafy green kale, orange carrots with stems attached, and yellow summer squash. Natural lighting highlighting the textures and colors.

Tutaj chciałem sprawdzić, jak dobrze AI słucha się prompta. 5 różnych warzyw do wkomponowania, mają poprawnie wyglądać i zachęcać do zakupu. Wygrywa Ideogram 3. Dobrze wygląda zdjęcie i jeżeli chodzi o realność, to tylko jarmuż nie prezentuje się najlepiej. Flux wypadł źle, prześwietlony i złe kształty wszystkich warzyw. Google ma świetne kształty, ale samo zdjęcie jest nudne (zbyt zwyczajne). GPT pojechał za bardzo saturacją. Midjourney ma małe problemy z kształtem papryki i nie jest to stół na targu. Ale podoba mi się ten obraz. Drugie miejsce dla Midjourney za fajność obrazu, ale drugie miejsce również dla Google za poprawność.

Moja Topka: Ideogram 3
Zrób quiz, znajdź Twój ulubiony generator

Kategoria Logo Geometryczne

Prompt

Geometric wolf head logo formed by interconnected thin lines and abstract shapes. Minimalist black and white design with negative space creating subtle secondary images within the main silhouette.

Spodziewałem się gorszych wyników. Ale wszystkie AI bardzo dobrze sobie tu poradziły. Kwestia preferencji. Dlatego postanowiłem zrobić drugą kategorię z trudniejszym logo.

Kategoria Logo Vintage

Prompt

A circular vintage-style stamp logo featuring a rugged old seaman with a small pipe in his mouth. The weathered sailor has a thick beard and traditional captain’s hat. The circular border contains the text "MARINA BARBER" in distressed serif typography. Black and white design with aged texture and subtle maritime elements like rope or anchor details around the border.

Zostałem zaskoczony! Midjourney 7 jest najbardziej spójny. Wszystko pasuje do siebie - nie ma ani za dużo, ani za mało elementów. Font świetny, detale również. Pozostali gracze wygenerowali słabsze propozycje, które albo zawierały błędy, albo były po prostu dziwaczne. ChatGPT również stworzył bardzo ładną grafikę, choć niepotrzebnie dodał zbyt wiele ozdobników i tekstur.

Moja Topka: Midjourney 7
Zrób quiz, znajdź Twój ulubiony generator

Kategoria Mockup

Prompt

Realistic 3D mockup of an unfolded cardboard hamburger box with eco-friendly kraft material. Clean design with subtle branding, visible creases and folds, photographed on a neutral surface with professional product lighting.

Hmmm... Mamy tylko jednego gracza. ChatGPT lub Sora 4o jako jedyni wykonali zadanie poprawnie. Midjourney, jak w wersji 6, dorzuca hamburgera gratis do opakowania. Widzę, że informacje o zagięciach w prompcie zmyliły inne modele. Wybrałem pudełko hamburgerowe, bo jest dość trudne do wykonania. Inne mockupy jak kubki czy ramki na plakaty to każdy model potrafi wygenerować.

Moja Topka: ChatGPT 4o
Zrób quiz, znajdź Twój ulubiony generator

Kategoria Mocne zdjęcie

Prompt

A solitary figure standing at the edge of a storm-swept cliff, silhouetted against a turbulent sky with dramatic cloud formations. Dark moody tones with hints of fading light breaking through, creating a powerful atmosphere of contemplation and resilience.

W tej kategorii Claude AI wymyślił mocnego prompta, który miał pokazać emocje. Liczyłem na to, że Midjourney pokaże swoje skrzydła, i faktycznie tak się stało. Jest coś w tym obrazie od Midjourney, coś, czego pozostałe obrazy nie mają. Inne modele poszły bardziej realistycznie, ale to odebrało właśnie temu artystycznemu vibeowi. Tu pewnie każdy będzie miał swoją opinię. Zauważ jednak ten pomarańczowy odcień obrazów z Open AI (ChatGPT). Mam wrażenie, że wszystkie obrazy z GPT mają nieco pomarańczowy ton.
Zrób quiz, znajdź Twój ulubiony generator

Autopromocja

To mój ebook o stylach w AI. Ponad 150 różnych przykładów i promptów które możesz wypróbować w swoich AIach. Nie tylko dla Midjourney! A nawet może się przydać grafikom którzy nie chcą używać AI.

Kategoria Flatlay

Prompt

a flat lay of a cosmetic products. light pink background use #f3c8e9, some small dried flowers in the scene. Make the cosmetic bottle have no branding.

Sprawdźmy czy dostaniemy dokładny hex kod koloru. Niestety, żaden z AI modeli nie użyło dobrego koloru. Byli blisko, najbliżej Ideogram i chatGPT. Choć wszystkie flatlaye są fajne, to tylko kilka z nich można faktycznie użyć w kreacji. Flux, Google i poniekąd ChatGPT mają za dużo elementów w scenie. Czasami taki look szukamy, czasami chcemy minimalizm. Chyba dam wygraną dla Google tym razem. Midjourney jest świetne, ale zbyt brązowe. Ideogram ma artefakty tekstowe.

Moja Topka: Google Image gen 3
Zrób quiz, znajdź Twój ulubiony generator

Kategoria Ilustracja Fantasy

Prompt

an oil painting style illustration for a fantasy card. A hairy beast weilding an axe. In the distance jagged mountains. The scene has dynamics and wow effects

Przyznam, że stworzyłem tę kategorię z myślą o Flux. Ten model zwykle daje bardzo dobre rezultaty w dziedzinie fantasy i ilustracji malowanych. Nie wiem, co się wydarzyło Ideogramowi w tej konkurencji, ale zajmuje ostatnie miejsce. Tutaj kompletnie nie trafili. Ani kolory, ani układ, ani postać mi się nie podobają. Google i ChatGPT wypadły raczej przeciętnie. Zwróć uwagę znów na dziwny pomarańczowy filtr na obrazie z GPT (to już któryś raz z rzędu). Flux zajmie drugie miejsce, bo wyszło nieco zbyt plastikowe. Tę kategorię przyznaję Midjourney. Gdy zobaczyłem chmury w tej ilustracji, od razu wiedziałem, że to jest to, o co mi chodziło. Może chciałbym więcej dynamiki, ale kolory i postać - wszystko idealnie pasuje.

Moja Topka: Midjourney
Zrób quiz, znajdź Twój ulubiony generator

Kategoria Wiele Twarzy

Prompt

a photo featuring several people posing for a photo. They are diverse in race, clothing and colors. In the distance add a palm tree

Bez wątpienia chatGPT 4o tu wygrywa. Znowu ma ten tajemniczy pomarańczowy filtr, ale to zdecydowanie najlepsze zdjęcie. Midjourney i Ideogram mają wciąż problemy z wieloma twarzami na raz, ale jest dużo lepiej niż parę miesięcy temu. Google i Flux pokazały "diversity" dość jednorasowo :P he he he.

Moja Topka: ChatGPT
Zrób quiz, znajdź Twój ulubiony generator

Wnioski

Łooo Pani/Panie!

To nie takie proste. Wygląda na to że każdy z autorów modeli AI do tworzenia grafik jest skupiony na innym aspekcie.

Jest Google, który do bólu chce być realny, ale czasami przez to nudny. Minus punkty za AI moderatora, w Google często zablokuje generowanie obrazu, bo uznaje go za niezgodny z regulaminem.

Ideogram, który stara się być lepszy od Midjourney i często mu się udaje. Najbardziej mnie zaintrygował ten model.

Flux jest najtańszy, ale wymaga wielu prób i dopracowania prompta. Może dlatego wielu dostawców korzysta z Fluxa pod spodem, dodając własny system prompt. Tak jak Freepik, chyba nawet Adobe też. (Rzekomo Adobe przestało inwestować we własne AI, woląc skorzystać z gotowych rozwiązań).

ChatGPT pokazał konkurencji, że potrafi zrobić generator obrazów i to jaki! Dobrze trzyma się prompta, tworzy wersje PNG z przezroczystością i ma wiele różnych zastosowań.

Midjourney jest najbardziej dojrzały. Ale twórcy są bardziej skupieni na feelingu, vibe'ie i estetyce obrazu.

Po tym porównaniu zrozumiałem, że na dzień dzisiejszy nie ma jednego modelu AI, który spełni wszystkie wymagania designera. Czyli idealnego stock fotografa, kreatora logo, social media obrazo-ogarniacza i wektoryzatora. Pominąłem w rankingu Recraft, który też bardzo dobrze generuje i potrafi tworzyć wektory SVG!

Wydawało mi się, że po tym, co wypuścił ChatGPT, i jak średnio wypadł Midjourney 7 w dniu premiery, to czas zakopać subskrypcję Midjourney i znaleźć coś nowego (Ideogram? ChatGPT?). Ale jednak Midjourney wciąż generuje te "ładne" zdjęcia. Tak jak do tej pory. Można nauczyć go swojego stylu (personalize).

Jasne! ChatGPT zrobi lepszy mockup, stworzy PNG, lepiej poradzi sobie z tekstem, łatwiej się go obsługuje. Ale mam takie dziwne wrażenie, że wszystkie obrazy z ChatGPT są do siebie podobne. Wejdźcie sobie na stronę explore Sora. Odnoszę wrażenie, że każdy obraz ma tę samą paletę barw. Nie wiem jak to dokładnie określić :P. Ideogram i Freepik mają masę dodatkowych funkcji i bajerów, które można zastosować do wygenerowanego obrazu, a mimo tego wolę Midjourney.

Zapraszam do przeanalizowania moich obrazów, sami wybierzcie model który Wam najbardziej odpowiada. Może w przyszłości znajdzie się taki model, który będzie miał wszystkie funkcje i będzie dobry z każdej perspektywy.

Tabelkę można przewijać w prawo.

	Midjourney	Ideogram	Flux	ChatGPT	Google
Ilość obrazów	4	4	1	1-4	1
Czas generowania	~30s	~30s	~10s	~90s	~10s
Obsługa	Strona WWW	Strona WWW	API	Strona WWW	API
Koszt (Polecany plan)	$30/mc - Standard ¹	$20/mc - Pro	~ 0.05$/obraz	$20/mc - chatGPT Plus	~ 0.08$/obraz
Limity planu	15h Fast hours ~ 1500 obrazów/mc	1000 kredytów ~ 250 obrazów/mc	brak	to skomplikowane ²	brak
Rozdzielczość	~1024x1024	~1024x1024	~1088x1088	~1024x1024	~1280x1280
Upscaler	do 2048px	do 2048px	brak	brak	brak
Wariacje obrazu (remix)	tak	tak	nie	tak	nie
Style Reference	tak	tak	nie	chyba	nie
Przeźroczyste .png	nie	nie ³	nie	tak	nie
Edytor obrazów ⁴	tak	tak	nie	tak ⁵	nie
Rozmowa z AI ⁶	prawie ⁷	nie	nie	tak	nie

¹ Roczny plan Midjourney jest tańszy. Pakiet basic w Midjourney nie polecam, to tylko 200 obrazów
² Nie ma wprost info o limitach generowania obrazów, ale są limity promptów na dzień w samym GPT (ok. 50 na 3h). Limity są uzależnione od przeciążenia serwerów chataGPT.
³ Ideogram ma funkcję usuń tło po generacji, jest wystarczająco dobry, podobnie jak w Photoshopie
⁴ Edytor uważam za funkcję gdzie można coś wygumkować lub zaznaczyć i regenerować
⁵ ChatGPT 4o nie ma edytora, ale można zapytać chataGPT o zmiany (konwersacjonalnie)
⁶ Czy AI pamięta prompt i kontekst i można dalej nad tym dalej pracować
⁷ Midjourney 7 draft mode umożliwia zachowanie kontekstu, w prompcie można wpisać np. "usuń x z tła"

12 Archetypów brandingu

Prawa UX

Stwórz własną kartę kolekcjonerską

Dołącz na Instagramie

Kurs Midjourney dla Grafików

Szkolenie B2B Midjourney

Poradnik Midjourney AI

Który AI najlepszy dla grafika?

Który AI jest najlepszy do obrazów?

Kategoria Fashion

Prompt

Kategoria Plakat (tekst)

Prompt

Kategoria Warzywa

Prompt

Kategoria Logo Geometryczne

Prompt

Kategoria Logo Vintage

Prompt

Kategoria Mockup

Prompt

Kategoria Mocne zdjęcie

Prompt

Autopromocja

Kategoria Flatlay

Prompt

Kategoria Ilustracja Fantasy

Prompt

Kategoria Wiele Twarzy

Prompt

Wnioski