OpenAI kasuje Dall-E!
Na jego miejsce wchodzi nowy, potężny ChatGPT 4o Image Generator.
Nazwa może nie zapada w pamięć, ale twórcy ChatGPT wysoko postawili poprzeczkę generatorom AI obrazów.
Generator lepszy niż Midjourney?
Nowy model bardzo dobrze generuje obrazy i fotografie. Momentami powiedziałbym, że lepiej niż Midjourney. Pozwala również na używanie znanych marek oraz twarzy, ale umożliwia jedynie wygenerowanie bezpiecznych obrazów. Np. prezydenta, który delektuje się lodami przejdzie, ale różne próby niesmacznych scen zostaną zablokowane.
Czy to wada czy zaleta? Nie wiem.
Nowe możliwości i ograniczenia 4o
Może zauważyliście falę animowanych przeróbek memów w stylu Ghibli - to właśnie z ChatGPT. Nie wiem, czy Studio Ghibli będzie z tego zadowolone, ale z drugiej strony takiego mocnego marketingu dawno nie mieli :D
Ciekaw jestem, czy jednak pewne restrykcje się nie pojawią.
Apropos restrykcji, OpenAI wdrożył nowy system zaszyfrowanych metadanych do każdego generowanego obrazu. W ten sposób narzędzia do sprawdzania AI łatwo wykryją, kto i kiedy go wygenerował.
Dostępność dla użytkowników
Image Generator 4o powinien być dostępny dla wszystkich, nawet na darmowym ChatGPT, ale w dniu pisania tego posta tak nie było. Tylko użytkownicy płatnych kont mieli do niego dostęp. Pewnie to kwestia czasu, zanim trafi do wszystkich.
Jak działa nowy 4o image generator?
Swoją drogą, ten nowy generator jest bardzo ciekawy, ponieważ wykorzystuje nowatorską technologię. Wszystkie dotychczasowe generatory obrazów korzystały z dyfuzji - w skrócie budowanie obrazów poprzez usuwanie szumu (noise), plus skomplikowana matematyka. Nowy generator od OpenAI też korzysta z dyfuzji, ale w małych “kosteczkach”, które wypełnia po kolei. To taka fuzja autoregresji z dyfuzją.
Nie sądziłem, że takie połączenie jest możliwe.
Przyszłość rynku generatorów AI
Czy to oznacza koniec Midjourney jako króla generowania obrazów? Zobaczymy!
Midjourney 7 ma wyjść w kwietniu. Twórcy zapowiadali idealną anatomię, ulepszenia jakości i nowe narzędzia.
Porównanie ChatGPT 4o z Midjourney - kto wygrywa bitwę o generowanie obrazów?
Nowy model GPT-4o od OpenAI wprowadza zupełnie nową jakość w generowaniu obrazów. W porównaniu z Midjourney, ChatGPT 4o wyróżnia się przede wszystkim dokładnością w interpretacji promptów i zdolnością do poprawnego renderowania tekstu w obrazach.
Midjourney nadal góruje pod względem artystycznej jakości, bogactwa szczegółów i ogólnej estetyki wizualnej.
Kluczowe różnice między tymi narzędziami:
• ChatGPT 4o doskonale radzi sobie z dokładnym odwzorowaniem promptu, szczególnie gdy chodzi o układy, tekst i konkretne ograniczenia
• Midjourney tworzy bardziej kinowe, szczegółowe i często zachwycające wizualnie obrazy
• ChatGPT 4o umożliwia edycję istniejących obrazów poprzez analizę i interpretację, czego Midjourney nie potrafi
• Midjourney jest znacznie szybszy w generowaniu obrazów i oferuje więcej opcji dostosowywania (proporcje, styl, skalowanie)