Spodziewasz się płaczu o tym, że obrazy z AI nie mają duszy? To nie będzie ten artykuł.
Pomogłem koledze stworzyć książkę dla jego córek. Fabuła wymyślił z pomocą ChatGPT, ilustracje bohaterek i tła zrobiłem w Midjourney oraz Nano Banana. Same postacie Smoksów zaprojektowałem sam, bo na nich zależało mi najbardziej. Książka istnieje, jest wydrukowana, można ją przekartkować. A mimo to nie czuję tego sukcesu tak, jak powinienem. I długo zastanawiałem się dlaczego.
To nie wina AI. To wina moich oczekiwań
Najłatwiej byłoby powiedzieć, że obrazy z AI są zimne i bez życia. Ale to nieprawda. Problem był odwrotny: AI za mało mi pomogło, żebym poczuł z tego frajdę.
Teksty z ChatGPT były OK, ale w praktyce jakieś 80% przepisaliśmy ręcznie. Fabułę przerabialiśmy wielokrotnie, dużo pierwszych pomysłów wylądowało w koszu. Ciężko nawet powiedzieć, ile ostatecznie zrobiła maszyna, a ile my. To nie była produkcja na guziku. To była walka.
Powód pierwszy: tysiące obrazów w koszu
Midjourney i Nano Banana wypluły razem ponad 8 tysięcy obrazów. Użyłem może 300. Brzmi jak gigantyczne marnotrawstwo, ale spójrz na to inaczej. Na weselu fotograf pstryka tysiące zdjęć, a do albumu trafia setka. Generowanie wariantów to nie błąd, to natura tego medium.
Powód drugi: drukarze kontra chińska fabryka
Tu się przyznaję do uprzedzenia: mam wieczny zatarg z drukarzami. Wielu z nich to Jaśnie Panie, którzy nie przyjmą pliku, jeśli nie jest idealnie przygotowany, w ich formatach, CMYK-ach i innych mykach.
A potem chińska fabryka, gdzie masowo produkujemy książkę, przyjęła każdy plik, nawet bez spadów, i wydrukowała świetnie. Powiedziałbym, że lepiej niż niejeden elitarny drukarz z Europy.
Ale uczciwie: te wymagania nie biorą się znikąd. Standardy przygotowania pliku istnieją, bo chronią przed rozjechanym kolorem i ucięciem treści.
Powód trzeci: eh, ten InDesign
W połowie projektu zmieniliśmy format na mniejszy i dostaliśmy rasową edytorkę, która przeniosła wszystko do InDesigna. Dla mnie to było nieintuicyjne i nieprzyjemne. Ale tu muszę uczciwie dodać: InDesign jest standardem branżowym do składu publikacji nie bez powodu. To nie program jest zły, to ja jestem programistą interfejsów. Preferuje rzeczy z intuicyjnym UX.
AI do kodu mnie wyzwala. AI do grafiki jeszcze nie
Tu jest sedno. Przy kodowaniu siadam, wymyślam, a AI produkuje. To uczucie jest wyzwalające. Przy grafice ciągle siłuję się z promptami, składam kolaże ręcznie i walczę o kontrolę.
Midjourney ma Omni-Reference do trzymania spójnej postaci, a Nano Banana (czyli Gemini 2.5 Flash Image od Google) został zaprojektowany pod konwersacyjną edycję i utrzymywanie spójności postaci między kolejnymi obrazami. Ale to jeszcze nie jest ta kontrola o której marzę.
Morał: kreatywność człowieka wzmocniona maszyną, nie odwrotnie
Największy błąd to założenie, że AI zrobi wszystko dobrze samo. Nie zrobi. Z AI trzeba współpracować, a nie zlecać i czekać na cud. Najlepsze efekty wyszły tam, gdzie maszyna wzmacniała moją robotę, a nie ją zastępowała.
Na razie po prostu wolę cyfrowe media. Strony, PDF-y, ekran. Choć muszę przyznać, że przekartkowanie wydrukowanej książki było cudownym uczuciem. Może za rok, może za dwa będę tworzył drukowane rzeczy z tym samym uśmiechem, co dziś oprogramowanie. Ale ten moment jeszcze nie nadszedł.
















