Jak Midjourney usprawnia generowanie grafik 

BY Anna Mitranka

Midjourney, obok DALL-E i Stable Diffusion, to jeden z najpopularniejszych generatorów obrazów wykorzystujących sztuczną inteligencję i uczenie maszynowe.

Na podstawie opisu tekstowego (prompt), jest on w stanie wygenerować hiperrealistyczne grafiki, zdjęcia, grafikę 3D czy ilustracje w rozmaitych stylach. Jak może pomóc w pracy agencji? O tym pokrótce w artykule.

Jak działa Midjourney?

Algorytmy Midjourney generują obrazy z setek milionów grafik opublikowanych w internecie. Co kilka miesięcy firma udostępnia nowy model, który oferuje nieco inne możliwości. Obecnie domyślna jest wersja 5.2, która pozwala generować najbardziej szczegółowe wyniki o lepszych kolorach, kontraście i kompozycji. Wersja ta lepiej też radzi sobie także z interpretacją promptów.

Jeśli jednak efekty naszych wyszukiwań nie są zadowalające, warto porównać je z wynikami uzyskanymi dzięki wcześniejszym wersjom programu. Wystarczy do promptu dodać parametr — version lub jego skrót — v (np. — v 5.1), albo też odpowiednio skonfigurować ustawienia z użyciem polecenia /settings.

Jak korzystać z Midjourney?

Obecnie nie ma możliwości skorzystania z bezpłatnej wersji programu. Midjourney oferuje trzy poziomy subskrypcji Basic, Standard i Pro, a ich koszt zaczyna się od 10 dolarów miesięcznie.

Usługa jest dostępna przez bota na oficjalnym serwerze Midjourney na platformie Discord. Możemy skorzystać z niej, wysyłając bezpośrednie zapytanie do bota lub zapraszając bota na własny serwer na Discord. Aby wygenerować obraz, należy użyć polecenia /imagine i wpisać prompt. Algorytmy wygenerują cztery obrazy. Wybrany wariant możemy powiększyć, używając buttonu U (Upscale). Możemy też wygenerować nowe iteracje wybranego wariantu, przyciskając button V (Variations). Jeżeli chcesz, by algorytm wygenerował od nowa obrazy dla danego promptu, kliknij button ze strzałkami (symbol odświeżenia).

Szybkość to ogromna zaleta Midjourney. Obrazy dosłownie powstają na naszych oczach. Korzystając z trybu szybkiego (fast), można stworzenie obraz w około 1 minutę. W trybie wolnym (relaxed) trwa to o wiele dłużej. Jednak by ten czasie był zmarnowany, kluczowy jest dobry prompt. 

Interesuje Cię, jak można wykorzystać Midjourney w Twojej firmie?

Jak stworzyć prompt?

Na stronie midjourney.com znajdziemy taką definicję promptu:

“Prompt to krótka fraza tekstowa, którą Midjourney Bot interpretuje w celu wytworzenia obrazu. Midjourney Bot dzieli słowa i frazy w monicie na mniejsze części, zwane tokenami, które można porównać z danymi treningowymi, a następnie użyć do wygenerowania obrazu…”. (źródło: https://docs.midjourney.com/docs/prompts).

Aby uzyskać efekty jak najbardziej odpowiadające naszym oczekiwaniom, musimy nauczyć się tworzyć zaawansowane prompty. Takie zapytanie powinno dookreślać takie elementy jak:

Obiekt: postać, zwierzę, miejsce, przedmiot etc.

Technika: zdjęcie, obraz, ilustracja, rzeźba, rysunek, gobelin, etc.

Otoczenie: w domu, w ogrodzie, pod wodą, w mieście etc.

Oświetlenie: miękkie, neonowe, ambient, studyjne, etc.

Kolor: jaskrawy, stonowany, jasny, czarno-biały, pastelowy, itp.

Nastrój: radosny, spokojny, melancholijny etc. 

Kompozycja: portret, zbliżenie, ujęcie z góry, panorama etc.

Kluczowe jest również wykorzystywanie parametrów, które nakierowują algorytmy, zmieniając sposób wyszukiwania obrazu. Są one dokładnie i obrazowo opisane są na stronie Midjourneyw sekcji „User Guide”. Najważniejsze z nich to:

  • Version (– version,–v) – opisany już wyżej parametr, pozwalający na wybór wersji algorytmu.
  • Aspect Ratios (–aspect lub –ar ) – zmienia proporcje wygenerowanego obrazu. Współczynnik proporcji to stosunek szerokości do wysokości obrazu. Przykładowy parametr: –ar 16:9.
  • Chaos (–chaos <liczba 0-100> – im wyższy parametr, tym bardziej nietypowe i nieoczekiwane generacje.
  • No (–no) – negatywne podpowiedzi, –no plants będą próbowały usunąć rośliny z obrazu.

  •  Quality (– quality lub — q)Określa ilość czasu na generowanie obrazu (dla bieżącego modelu akceptuje tylko wartości: .25, .5 i 1). Wyższa wartość = więcej czasu na wygenerowanie grafiki.

  • Repeat (lub repeat lub —  r) Uruchamia zadanie wielokrotnie.

  • Seed (– seed) Bot Midjourney używa numeru ziarna do utworzenia pola szumu wizualnego, takiego jak zakłócenia telewizyjne, jako punktu początkowego do wygenerowania początkowych siatek obrazów. Numery seed są generowane losowo dla każdego obrazu, ale można je określić za pomocą parametru –seed lub –sameseed. Użycie tego samego numeru ziarna i podpowiedzi spowoduje wygenerowanie podobnych obrazów końcowych.

  • Stop (– stop) Pozwala zakończyć zadanie w połowie procesu.

  • Style (– style lub — s) Pozwala modyfikować domyślną estetykę danej wersji Midjourney. Wersja 5.2 i 5.1 akceptują –style raw. Obrazy wykonane przy użyciu –style raw mają niższy poziom automatycznego upiększania. Wersja Niji 5 akceptuje –style cute –style scenic –style original lub –style expressive.

  • Stylize (– stylize lub — s) Im niższa wartość stylizacji, tym mniejsza wartość artystyczna obrazu. Wysokie wartości to obrazy ciekawsze artystycznie, ale mniej związane z podpowiedzią.

  • Tile (– tile) Generuje obrazy, które mogą być używane jako powtarzające się kafelki do tworzenia bezszwowych wzorów.

  • Version (– version lub –v) Opisany już wyżej parametr, pozwalający na wybór wersji algorytmu.

  • Video (– video) Pozwala na tworzenie krótkich filmów z wygenerowanych obrazów.

  • Weird (—weird lub — w) Funkcja eksperymentalna, która pozwala na uzyskanie niecodziennych wyników, zmodyfikowanych o dziwaczne i nieprzewidziane elementy.

Midjourney pozwala także na tworzenie zaawansowanych promptów obrazkowych. Do promptu można dodać adres URL obrazka, by nakierować algorytmy na oczekiwany efekt. Adresy URL obrazków zawsze znajdują się na początku podpowiedzi.

Można także skorzystać z komendy /blend, by zmiksować ze sobą wybrane obrazy, a także eksperymentować z kolejnymi wariantami obrazów, korzystając z komendy /remix.

Midjourney pozwala także na tworzenie zaawansowanych promptów obrazkowych. Do promptu można dodać adres URL obrazka, by nakierować algorytmy na oczekiwany efekt. Adresy URL obrazków zawsze znajdują się na początku podpowiedzi. 

Komendy

Inną ważną kategorią są komendy. Najnowsza wersja 5.2 wprowadziła komendę /shorten.

/shorten

Analizuje promet i podkreśla istotne słowa i sugeruje które słowa można usunąć.

Inne komendy to m.in.:

/blend

Pozwala zmiksować ze sobą wybrane obrazy.

/describe

Tworzy cztery przykładowe prompty na podstawie przesłanego obrazu.

/remix

Umożliwia eksperymentowanie z kolejnymi wariantami obrazów.

/info

Wyświetla informacje o koncie użytkownika, a także aktualnych zadaniach.

/settings

Wyświetla ustawienia bota Midjourney.

Wersja 5.2 – ulepszenia

Oprócz wspominanej komendy /shorten nowa wersja Midjourney została wzbogacona o ciekawe funkcje, które warto poznać jak Zoom Out, Make Square i konfigurowalne wariacje.

Zoom Out

Teraz można skorzystać z funkcji Zoom Out, która imituje oddalenie w aparacie fotograficznym, generując scenę dookoła wygenerowanego obiektu. Wystarczy wygenerować obraz, a następnie użyć przycisków Zoom pod spodem. Współczynnik pomniejszenia to x1,5, x2 lub niestandardowa wartość od 1 do 2.

W końcu – mamy także do dyspozycji Custom Zoom, funkcję pozwalającą na manipulowanie proporcjami obrazu – np. po ustawieniu Custom Zoom można edytować współczynnik proporcji (–ar) oraz ustawić pożądaną wartość Zoom.

Make Square

Dostępna jest też funkcja Make Square, która pozwala uzyskać kwadratowy format z pozyskanej grafiki. W przypadku obrazów o aspekt ratio innym niż 1:1 ta funkcja wypełni brakującą przestrzeń tak, by powstała grafika w formacie kwadratu.

Konfigurowalne wariacje

Użytkownicy mają teraz do dyspozycji buttony Vary Strong i Vary Subtle, dzięki którym mogą modyfikować wyniki bez zmiany promptu. Vary Strong pozwala na silniejszą modyfikację wyniku, Vary Subtle delikatniejszą. Zmiany uzyskane dzięki tej funkcji nie są przewidywalne, a przez to pozwalają na eksperymentowanie z wynikami.

Midjourney – zalety i wady

Zaletą Midjourney jest z pewnością przyjazność. Narzędzie pozwala w prosty sposób generować grafiki także osobom początkującym w świecie AI. Zastosowanie parametrów pozwala dostosować działanie algorytmu do oczekiwanych efektów i daje możliwość kontrolowania efektów w dość dużym zakresie. 

Wadą narzędzie jest wciąż ograniczony realizm. I nie chodzi tylko o takie powszechne błędy jak liczba palców. Po prostu algorytm potrafi zinterpretować zapytania tekstowe w nieprzewidywalny sposób. To sprawia, że modyfikacje jednego słowa w prompcie może sprawić, że wygenerowany zostanie całkowicie inny obraz.

Chcesz efektywnie wykorzystywać Midjourney do swoich celów?

Midjourney a praca w agencji 

Agencje reklamowe szybko zaczęły wykorzystywać możliwości, jakie daje Midjourney. 

Sprawdza się zwłaszcza na etapie wizualizacji pomysłów –  czy na potrzeby wewnętrznego brainstormingu, czy na etapie prezentacji pomysłów klientowi. W kilka chwil możemy wygenerować obraz, który pozwoli klientowi poczuć koncept, a nie tylko sobie go wyobrazić. Midjourney pozwala przekroczyć ograniczenia banków zdjęć, tworząc na żądanie najbardziej nieprawdopodobne grafiki czy zdjęcia. To również świetne narzędzie do generowania moodboardów. Z naszych doświadczeń wynika, że całkiem nieźle sprawdza się jako pomoc w generowaniu storyboardów – choć z uwagi na to, że zachowanie spójności wciąż bywa wyzwaniem, należałoby potraktować to narzędzie raczej jako wsparcie prac i sposób na szybszą ich realizację. 

Wygenerowane grafiki:

Hyper-realistic image of a simple monochromatic cup with coffee with a latte art pattern at the top. The latte art pattern depicts musical notes and a heart. A green cup on a monochromatic pink background. –ar 4:5 –s 750 –v 4 –

Illustration showing the entire globe in space. A little boy and a little white bear are standing on top of the globe. The boy is holding a candle in his right hand and stroking the bear with his left. 

Transparent spray plastic bottle for detergent filled with many layers of soil, sand, grass and a single small daisy flower. White bacground. Hyperrealistic graphics. –ar 4:5

A hiperrealistic lollipop made of fried chicken, red background –ar 4:5 –s 750 –v 5 –c 50

A bottle of olive oil at yellow background, surrounded by yellow fruit and vegetables, flat com position, monochromatic, essential, hyperrealistic –ar 4:5 –s 750 –v 5 –c 50

A storyboard full color sketch depicting people packing crates of olives onto the ca r’s trunk in an Olive Garden, wide frame, full-body image –ar 7:4 –s 750 –v 5

Zakończenie:

Podsumowując, Midjourney stanowi znaczący postęp w dziedzinie grafiki generowanej przez AI. Jego zdolność do interpretacji tekstowych poleceń i tworzenia szczegółowych, realistycznych obrazów otwiera nowe możliwości dla kreatywności i efektywności w projektowaniu graficznym. Mimo pewnych ograniczeń, ciągłe ulepszenia i aktualizacje Midjourney wskazują na obiecującą przyszłość AI w branżach kreatywnych.

FAQ: Midjourney w Generowaniu Grafiki

Czym jest Midjourney?
Odpowiedź: Midjourney to generator obrazów oparty na AI, który tworzy hiperrealistyczne grafiki, zdjęcia, grafiki 3D lub ilustracje z opisów tekstowych.

Jak działa Midjourney?

Odpowiedź: Midjourney używa algorytmów do generowania obrazów z ogromnej bazy grafik internetowych, interpretując tekstowe polecenia, aby tworzyć wizualizacje.

Jakie są poziomy subskrypcji Midjourney?

Odpowiedź: Midjourney oferuje trzy poziomy subskrypcji: Basic, Standard i Pro, zaczynając od 8 dolarów miesięcznie.

Jakie są zalety i wady Midjourney?

Odpowiedź: Midjourney jest przyjazny dla użytkownika i wszechstronny, ale czasami ograniczony pod względem realizmu i może nieprzewidywalnie interpretować polecenia.

Jak Midjourney jest korzystny dla agencji reklamowych?
Odpowiedź: Midjourney pomaga szybko wizualizować pomysły, tworzyć unikalne grafiki i wspomagać storyboard, zwiększając kreatywność i efektywność.

Anna Mitranka
copywriter

Anna pracuje w naszym zespole copywriterskim od kilku lat. To żadna tajemnica, że dzięki jej umiejętnościom wygrywamy przetargi i tworzymy treści dla klientów na najwyższym poziomie.

Zainteresował Cię ten temat i chciałbyś porozmawiać o podobnych działaniach w Twojej firmie?

Wypełnij formularz i umów się na 30-minutową, bezpłatną rozmowę strategiczną!

    Dziękujemy za wypełnienie formularza!

    Wkrótce skontaktujemy się z Tobą, by umówić zakres i termin spotkania. Na tej podstawie dobierzemy eksperta, który poprowadzi konsultacje.

    Życzymy udanego dnia :) zespół Neon Shake