Który AI jest najlepszy do obrazów?

Który AI jest najlepszy do obrazów?

Artykuł napisany w 2025. Może już być lekko nieaktualny!

Porównajmy Midjourney 7 vs Ideogram 3 vs Google Image Gen 3 vs Flux 1.1 vs ChatGPT. Który z tych generatorów obrazów jest najlepszy dla grafika. Ranking będzie subiektywny i według moich punktów kluczowych, ale postaram się wyrównać pole gry i wycisnąć najlepsze z każdej technologii. Poza tym każdy może ocenić na swój sposób :)

Dlaczego brakuje Adobe Firefly i Freepik? Ponieważ nic nowego nie dodali od ostatniego mojego testu. Zobacz porównanie z 2024 .

Obrazy będą w losowej kolejności w karuzelach.
W rankingu biorę pod uwagę:
  • Trzymanie się prompta,
  • Estetykę i "ładność" zdjęcia,
  • Czy o to mi chodziło (Czy obraz jest zbliżony do tego co sobie wyobrażałem)
Puszczam prompt tylko raz. Nie poprawiam prompta, nie ulepszam, jedynie ustawiam aspect ratio na 4:5. Chcę być fair.

Kategoria Fashion

Prompt

A high-fashion model with striking features, wearing avant-garde clothing against a minimalist studio background. Perfect lighting highlighting bone structure, dramatic shadows, professional portrait composition with shallow depth of field.

Tutaj szukałem czegoś z emocjami, czegoś nieco dziwnego. Flux, moim zdaniem, wypadł najgorzej. Pani pokazuje dość... dużo :P Flux jest zbyt gładki i plastikowy. Ideogram ma mniej doskonałą panią (bardziej naturalną?), ale coś mi w tym nie pasuje. Podobnie GPT - jest to świetne zdjęcie, ale czegoś mi brakuje. Dla mnie wygrywają Midjourney oraz Google Image Generator.

Top: Midjourney 7 i Google Image gen 3

Kategoria Plakat (tekst)

Prompt

Vintage-style travel poster of a mountain landscape at sunset with warm orange and purple hues. Bold text at the bottom reads "ADVENTURE AWAITS" in an elegant serif font.

Jeżeli chodzi o dobór fontów, wydaje mi się, że Flux i GPT wybrały najfajniejsze szeryfowe fonty. Podobają mi się ozdobniki w wersji od Google. Całość plakatu - najmniej podobają mi się Google i Ideogram. Są takie zbyt clipartowe, wektorowe. Za mało tego vintage vibe. Flux jest zbyt plastikowy, ale ma taki vibe D&D lub okładki ze starej książki Tolkiena. Midjourney to mocna średniawka. Tekst pasuje, ale miał być szeryfowy, jest to ładna ilustracja, ale nie porywa. GPT zrobił bardzo fajną ilustrację, troszeczkę za dużo się dzieje jak dla mnie, ale mimo tego wygrywa.

Top: ChatGPT/Sora

Kategoria Warzywa

Prompt

A vibrant farmers market display of fresh vegetables arranged artistically on a rustic wooden table: deep purple eggplants, bright red bell peppers, leafy green kale, orange carrots with stems attached, and yellow summer squash. Natural lighting highlighting the textures and colors.

Tutaj chciałem sprawdzić, jak dobrze AI słucha się prompta. 5 różnych warzyw do wkomponowania, mają poprawnie wyglądać i zachęcać do zakupu. Wygrywa Ideogram 3. Dobrze wygląda zdjęcie i jeżeli chodzi o realność, to tylko jarmuż nie prezentuje się najlepiej. Flux wypadł źle, prześwietlony i złe kształty wszystkich warzyw. Google ma świetne kształty, ale samo zdjęcie jest nudne (zbyt zwyczajne). GPT pojechał za bardzo saturacją. Midjourney ma małe problemy z kształtem papryki i nie jest to stół na targu. Ale podoba mi się ten obraz. Drugie miejsce dla Midjourney za fajność obrazu, ale drugie miejsce również dla Google za poprawność.

Top: Ideogram 3

Kategoria Logo Vintage

Prompt

A circular vintage-style stamp logo featuring a rugged old seaman with a small pipe in his mouth. The weathered sailor has a thick beard and traditional captain’s hat. The circular border contains the text "MARINA BARBER" in distressed serif typography. Black and white design with aged texture and subtle maritime elements like rope or anchor details around the border.

Zostałem zaskoczony! Midjourney 7 jest najbardziej spójny. Wszystko pasuje do siebie - nie ma ani za dużo, ani za mało elementów. Font świetny, detale również. Pozostali gracze wygenerowali słabsze propozycje, które albo zawierały błędy, albo były po prostu dziwaczne. ChatGPT również stworzył bardzo ładną grafikę, choć niepotrzebnie dodał zbyt wiele ozdobników i tekstur.

Top: Midjourney 7

Kategoria Mockup

Prompt

Realistic 3D mockup of an unfolded cardboard hamburger box with eco-friendly kraft material. Clean design with subtle branding, visible creases and folds, photographed on a neutral surface with professional product lighting.

Hmmm... Mamy tylko jednego gracza. ChatGPT lub Sora 4o jako jedyni wykonali zadanie poprawnie. Midjourney, jak w wersji 6, dorzuca hamburgera gratis do opakowania. Widzę, że informacje o zagięciach w prompcie zmyliły inne modele. Wybrałem pudełko hamburgerowe, bo jest dość trudne do wykonania. Inne mockupy jak kubki czy ramki na plakaty to każdy model potrafi wygenerować.

Top: ChatGPT 4o

Kategoria Mocne zdjęcie

Prompt

A solitary figure standing at the edge of a storm-swept cliff, silhouetted against a turbulent sky with dramatic cloud formations. Dark moody tones with hints of fading light breaking through, creating a powerful atmosphere of contemplation and resilience.

W tej kategorii Claude AI wymyślił mocnego prompta, który miał pokazać emocje. Liczyłem na to, że Midjourney pokaże swoje skrzydła, i faktycznie tak się stało. Jest coś w tym obrazie od Midjourney, coś, czego pozostałe obrazy nie mają. Inne modele poszły bardziej realistycznie, ale to odebrało właśnie temu artystycznemu vibeowi. Tu pewnie każdy będzie miał swoją opinię. Zauważ jednak ten pomarańczowy odcień obrazów z Open AI (ChatGPT). Mam wrażenie, że wszystkie obrazy z GPT mają nieco pomarańczowy ton.

Autopromocja

To mój ebook o stylach w AI. Ponad 150 różnych przykładów i promptów które możesz wypróbować w swoich AIach. Nie tylko dla Midjourney! A nawet może się przydać grafikom którzy nie chcą używać AI.

Kategoria Flatlay

Prompt

a flat lay of a cosmetic products. light pink background use #f3c8e9, some small dried flowers in the scene. Make the cosmetic bottle have no branding.

Sprawdźmy czy dostaniemy dokładny hex kod koloru. Niestety, żaden z AI modeli nie użyło dobrego koloru. Byli blisko, najbliżej Ideogram i chatGPT. Choć wszystkie flatlaye są fajne, to tylko kilka z nich można faktycznie użyć w kreacji. Flux, Google i poniekąd ChatGPT mają za dużo elementów w scenie. Czasami taki look szukamy, czasami chcemy minimalizm. Chyba dam wygraną dla Google tym razem. Midjourney jest świetne, ale zbyt brązowe. Ideogram ma artefakty tekstowe.

Top: Google Image gen 3

Kategoria Ilustracja Fantasy

Prompt

an oil painting style illustration for a fantasy card. A hairy beast weilding an axe. In the distance jagged mountains. The scene has dynamics and wow effects

Przyznam, że stworzyłem tę kategorię z myślą o Flux. Ten model zwykle daje bardzo dobre rezultaty w dziedzinie fantasy i ilustracji malowanych. Nie wiem, co się wydarzyło Ideogramowi w tej konkurencji, ale zajmuje ostatnie miejsce. Tutaj kompletnie nie trafili. Ani kolory, ani układ, ani postać mi się nie podobają. Google i ChatGPT wypadły raczej przeciętnie. Zwróć uwagę znów na dziwny pomarańczowy filtr na obrazie z GPT (to już któryś raz z rzędu). Flux zajmie drugie miejsce, bo wyszło nieco zbyt plastikowe. Tę kategorię przyznaję Midjourney. Gdy zobaczyłem chmury w tej ilustracji, od razu wiedziałem, że to jest to, o co mi chodziło. Może chciałbym więcej dynamiki, ale kolory i postać - wszystko idealnie pasuje.

Top: Midjourney

Kategoria Wiele Twarzy

Prompt

a photo featuring several people posing for a photo. They are diverse in race, clothing and colors. In the distance add a palm tree

Bez wątpienia chatGPT 4o tu wygrywa. Znowu ma ten tajemniczy pomarańczowy filtr, ale to zdecydowanie najlepsze zdjęcie. Midjourney i Ideogram mają wciąż problemy z wieloma twarzami na raz, ale jest dużo lepiej niż parę miesięcy temu. Google i Flux pokazały "diversity" dość jednorasowo :P he he he.

Top: ChatGPT

Wnioski

Łooo Pani/Panie!

To nie takie proste. Wygląda na to że każdy z autorów modeli AI do tworzenia grafik jest skupiony na innym aspekcie.

Jest Google, który do bólu chce być realny, ale czasami przez to nudny. Minus punkty za AI moderatora, w Google często zablokuje generowanie obrazu, bo uznaje go za niezgodny z regulaminem.

Ideogram, który stara się być lepszy od Midjourney i często mu się udaje. Najbardziej mnie zaintrygował ten model.

Flux jest najtańszy, ale wymaga wielu prób i dopracowania prompta. Może dlatego wielu dostawców korzysta z Fluxa pod spodem, dodając własny system prompt. Tak jak Freepik, chyba nawet Adobe też. (Rzekomo Adobe przestało inwestować we własne AI, woląc skorzystać z gotowych rozwiązań).

ChatGPT pokazał konkurencji, że potrafi zrobić generator obrazów i to jaki! Dobrze trzyma się prompta, tworzy wersje PNG z przezroczystością i ma wiele różnych zastosowań.

Midjourney jest najbardziej dojrzały. Ale twórcy są bardziej skupieni na feelingu, vibe'ie i estetyce obrazu.

Po tym porównaniu zrozumiałem, że na dzień dzisiejszy nie ma jednego modelu AI, który spełni wszystkie wymagania designera. Czyli idealnego stock fotografa, kreatora logo, social media obrazo-ogarniacza i wektoryzatora. Pominąłem w rankingu Recraft, który też bardzo dobrze generuje i potrafi tworzyć wektory SVG!

Wydawało mi się, że po tym, co wypuścił ChatGPT, i jak średnio wypadł Midjourney 7 w dniu premiery, to czas zakopać subskrypcję Midjourney i znaleźć coś nowego (Ideogram? ChatGPT?). Ale jednak Midjourney wciąż generuje te "ładne" zdjęcia. Tak jak do tej pory. Można nauczyć go swojego stylu (personalize).

Jasne! ChatGPT zrobi lepszy mockup, stworzy PNG, lepiej poradzi sobie z tekstem, łatwiej się go obsługuje. Ale mam takie dziwne wrażenie, że wszystkie obrazy z ChatGPT są do siebie podobne. Wejdźcie sobie na stronę explore Sora. Odnoszę wrażenie, że każdy obraz ma tę samą paletę barw. Nie wiem jak to dokładnie określić :P. Ideogram i Freepik mają masę dodatkowych funkcji i bajerów, które można zastosować do wygenerowanego obrazu, a mimo tego wolę Midjourney.

Zapraszam do przeanalizowania moich obrazów, sami wybierzcie model który Wam najbardziej odpowiada. Może w przyszłości znajdzie się taki model, który będzie miał wszystkie funkcje i będzie dobry z każdej perspektywy.

Tabelkę można przewijać w prawo.

MidjourneyIdeogramFluxChatGPTGoogle
Ilość obrazów4411-41
Czas generowania~30s~30s~10s~90s~10s
ObsługaStrona WWWStrona WWWAPIStrona WWWAPI
Koszt (Polecany plan)$30/mc - Standard 1$20/mc - Pro~ 0.05$/obraz$20/mc - chatGPT Plus~ 0.08$/obraz
Limity planu15h Fast hours ~ 1500 obrazów/mc1000 kredytów ~ 250 obrazów/mcbrakto skomplikowane 2brak
Rozdzielczość~1024x1024~1024x1024~1088x1088~1024x1024~1280x1280
Upscalerdo 2048pxdo 2048pxbrakbrakbrak
Wariacje obrazu (remix)taktaknietaknie
Style Referencetaktakniechybanie
Przeźroczyste .pngnienie 3nietaknie
Edytor obrazów 4taktaknietak 5nie
Rozmowa z AI 6prawie 7nienietaknie
  • 1 Roczny plan Midjourney jest tańszy. Pakiet basic w Midjourney nie polecam, to tylko 200 obrazów
  • 2 Nie ma wprost info o limitach generowania obrazów, ale są limity promptów na dzień w samym GPT (ok. 50 na 3h). Limity są uzależnione od przeciążenia serwerów chataGPT.
  • 3 Ideogram ma funkcję usuń tło po generacji, jest wystarczająco dobry, podobnie jak w Photoshopie
  • 4 Edytor uważam za funkcję gdzie można coś wygumkować lub zaznaczyć i regenerować
  • 5 ChatGPT 4o nie ma edytora, ale można zapytać chataGPT o zmiany (konwersacjonalnie)
  • 6 Czy AI pamięta prompt i kontekst i można dalej nad tym dalej pracować
  • 7 Midjourney 7 draft mode umożliwia zachowanie kontekstu, w prompcie można wpisać np. "usuń x z tła"