Midjourney 2026: kompletny przewodnik (V7, prompty, ceny, jak zacząć)

Praktyczny przewodnik po Midjourney 2026: jak założyć konto, jak pisać dobre prompty, jak działa V7, jak korzystać z web i Discord, ile kosztują plany, jakie są realne ograniczenia.

Pierwszą grafikę w Midjourney wygenerowałem w 2022, gdy V4 dopiero startowało. Prompt brzmiał: „a polish village house in autumn, sunset”. Wynik to było coś co dziś nazwałbym „akwarela z chińskiego sklepu z artykułami plastycznymi”. Cztery lata później ten sam prompt generuje obraz, który nie do odróżnienia od fotografii zrobionej Sony A7. Midjourney od V4 do V7 zrobił skok jakościowy porównywalny z całą historią fotografii cyfrowej od 2000 do 2020 — w trzy lata.

Mam za sobą tysiące generacji w Midjourney przez ostatnie 4 lata: dla klientów (mockupy produktowe, ilustracje do bloga, headery), dla siebie (eksperymenty stylistyczne, koncepcje projektów), dla nauki promptingu (testowanie, co działa, a co psuje obraz). Ten przewodnik jest sumą tej praktyki, nie suchym opisem features.

Co to jest Midjourney i czym różni się od konkurencji

Midjourney to generator obrazów AI stworzony przez niezależną firmę Midjourney Inc. z San Francisco, prowadzoną przez Davida Holza (wcześniej Leap Motion). Pierwsza publiczna wersja wyszła w 2022, projekt od początku skupiał się na fotorealizmie i estetyce, nie na technicznych innowacjach typu Stable Diffusion. To uczyniło Midjourney najlepszą opcją dla osób, które chcą piękne obrazy „natychmiast”, bez modyfikowania promptów godzinami.

W 2026 trzy główne konkurencje to DALL-E 3 (OpenAI, wbudowany w ChatGPT), Stable Diffusion XL i Flux (open-source, lokalne), Imagen 3 (Google, w Workspace i Vertex AI). Każdy ma swoją niszę:

Generator Mocna strona Słaba strona Cena startowa
Midjourney V7 Fotorealizm, estetyka „od ręki”, spójna stylistyka Mniej kontroli niż SD, brak edycji lokalnej 10 USD/mc
DALL-E 3 Najlepsze rozumienie promptów, integracja z ChatGPT Słabszy fotorealizm, „plastikowe” twarze 20 USD/mc (w ChatGPT Plus)
Stable Diffusion XL / Flux Pełna kontrola, lokalna generacja, custom modele Wymaga GPU, godziny nauki 0 zł (lokalnie)
Imagen 3 W cenie Google Workspace, dobra integracja z Docs/Slides Mniej rozbudowane prompty niż MJ W cenie Workspace

Wybór: Midjourney dla najlepszej estetyki out-of-the-box. DALL-E dla użytkowników już w ekosystemie ChatGPT. Stable Diffusion dla power-userów chcących pełnej kontroli. Imagen dla firm już płacących za Workspace.

Jak zacząć: Discord vs web app w 2026

Midjourney przez pierwsze 3 lata działało wyłącznie na Discord (przez bota, do którego wysyłałeś prompty). Od 2024 dostępny jest web app na alpha.midjourney.com, który stał się głównym interfejsem dla większości użytkowników w 2026. Discord nadal działa równolegle, ale web jest wygodniejszy.

  1. Załóż konto Midjourney: wejdź na midjourney.com, kliknij „Sign In”, wybierz logowanie przez Google albo Discord. Konto Discord jest wymagane nawet do web app (sync historii generacji).
  2. Wybierz plan: Basic 10 USD/mc (200 generacji „fast”, potem relax mode), Standard 30 USD/mc (15 godzin fast, unlimited relax), Pro 60 USD/mc (30 godzin fast plus stealth mode), Mega 120 USD/mc (60 godzin fast). Roczna subskrypcja daje 20 procent rabatu.
  3. Wejdź do web app: alpha.midjourney.com → „Create”. W górnym pasku wpisujesz prompt, w prawym panelu wybierasz parametry (aspect ratio, wersję modelu, style, stylization slider). Klikasz „Submit”, po 30 do 60 sekundach masz 4 wersje do wyboru.
  4. Lub Discord: dołącz do oficjalnego serwera Midjourney (zaproszenie z midjourney.com), wejdź na dowolny kanał #newbies-XX, wpisz /imagine prompt: twój opis. Bot wygeneruje 4 obrazy w tym samym kanale.
  5. Pobierz lub iteruj: w web app prawy klik na obraz → „Download”. Albo „Vary” (subtle/strong) dla wariacji, „Upscale” dla wersji 4K, „Remix” dla nowego promptu na bazie poprzedniego.

Pierwszy raz zajmuje 15 do 30 minut na ogarnięcie interface i wygenerowanie sensownych obrazów. Po tygodniu używania pełne flow zajmuje pod minutę per obraz (od pomysłu do gotowej grafiki).

Co nowego w V7

Midjourney V7 (wydany w 2025, default od końca 2025) wprowadził kilka zmian, które realnie wpływają na jakość obrazów:

Lepsze ręce i twarze: dwa największe problemy V5 i V6 (zniekształcone dłonie, dziwne wyrazy twarzy) są praktycznie rozwiązane. Ręce nadal czasem mają 6 palców, ale rzadziej i trudniej zauważalne.

Photorealism boost: faktura skóry, materiałów, oświetlenia są bardziej naturalne. V7 generuje obrazy, których nie da się odróżnić od profesjonalnej fotografii w 80 plus procentach przypadków (poza zbliżeniami dłoni i zegarków).

Faster speed: czas generacji 4 obrazów spadł z 60 do 30 sekund typowo (na fast hours), z 5 do 2 minut na relax mode.

Better prompt following: V7 lepiej rozumie złożone prompty z wieloma elementami (3 plus obiekty w scenie, multiple stylów). Nie tak dobrze jak DALL-E 3, ale znacząco lepiej niż V6.

Personalization (–p): trening modelu na twoich preferencjach przez ocenianie 200 plus par obrazów („który podoba ci się bardziej?”). Generuje obrazy bliższe twojemu osobistemu gustowi.

V6 nadal jest dostępny przez parametr --v 6, używany czasem dla artystycznych styles, w których V7 jest „zbyt realistyczny”. Wszyscy zalecam ćwiczenie z V7 jako default i zejście na V6 tylko jeśli konkretny styl tego wymaga.

Anatomia dobrego promptu

Prompt w Midjourney to nie zdanie po polsku ani opis sceny w stylu „proszę wygeneruj obraz X”. To słownikowa lista atrybutów oddzielonych przecinkami, z parametrami technicznymi na końcu. Struktura, której używam codziennie:

Template promptu[subject], [medium/style], [composition], [lighting], [mood], [details], [technical params]

Przykład realny dla bloga o gotowaniu:

Działający prompt V7rustic kitchen counter with fresh ingredients, photorealistic food photography, top-down shot, soft natural window light from left, warm cozy atmosphere, detailed wood grain texture, shallow depth of field, cinematic 35mm –ar 16:9 –v 7 –style raw

Co to robi: subject (rustic kitchen counter with fresh ingredients) określa, co ma być na obrazie. Style (photorealistic food photography) wymusza fotorealizm zamiast ilustracji. Composition (top-down shot) ustawia perspektywę. Lighting (soft natural window light from left) tworzy nastrój. Mood (warm cozy) wpływa na kolory. Details (detailed wood grain) doszczegóławia. Technical params: --ar 16:9 (proporcje 16:9), --v 7 (model V7), --style raw (mniej AI „polish”, bardziej naturalne).

Zła praktyka: „please make me a beautiful image of a polish village, very nice colors, perhaps with a sunset”. To zdanie po polsku/angielsku, Midjourney generuje, ale wynik jest losowy. Dobra praktyka: cięte słowa, konkretne atrybuty, parametry techniczne na końcu.

Kluczowe parametry, które trzeba znać

Parametr Co robi Przykład
--ar Aspect ratio (proporcje) --ar 16:9 (landscape), --ar 9:16 (portrait), --ar 1:1 (square)
--v Wersja modelu --v 7 (default), --v 6 (poprzedni), --niji 6 (anime style)
--style Wariant stylu --style raw (mniej AI polish), --style 4a/4b/4c (V4 styles)
--stylize Siła AI „artystycznego” wpływu (0–1000) --s 50 (mniej, bliżej promptu), --s 750 (default), --s 1000 (maksymalnie artystyczne)
--chaos Variability między 4 generacjami (0–100) --c 0 (4 podobne), --c 100 (4 mocno różne)
--no Negative prompt (czego unikać) --no text, watermark, blurry
--seed Stałość generacji (do reproduktywności) --seed 12345 (powtarzalny wynik)
--tile Tileable pattern (powtarzalna textura) --tile dla wallpaperów, tekstur

Najczęściej używam: --ar 16:9 dla bloga, --v 7 dla najlepszej jakości, --style raw dla fotografii, --no text, watermark dla czystych obrazów. Reszta parametrów wchodzi tylko wtedy, gdy konkretnie wiem czego chcę.

Style i moodboards

Midjourney działa świetnie z odniesieniami do konkretnych stylów artystycznych, fotografów, kierunków. Lista, którą stosuję w realnej pracy:

Fotografia: professional product photography, studio lighting, white background dla mockupów produktowych. street photography, 35mm film, grainy, kodak portra 400 dla obrazów raw. fashion editorial, high-end magazine style dla portretów.

Ilustracje: watercolor illustration, soft edges, pastel colors dla książek dla dzieci. flat vector illustration, minimal, geometric dla landing pages SaaS. 3D render, isometric, soft shadows dla diagramów technicznych.

Architektura/wnętrza: scandinavian interior, natural light, minimal furniture, off-white walls. brutalist architecture, concrete, monochrome, dramatic shadows.

Konkretni artyści: in the style of [artist name]. Działa dla znanych nazwisk (Wes Anderson, Annie Leibovitz, Henri Cartier-Bresson, Andy Warhol). Niektóre konkretne nazwiska (zwłaszcza żyjących artystów) są filtrowane od V6.

Czasy historyczne: 1970s polaroid aesthetic, 1990s film grain VHS look, victorian era oil painting. Świetnie odtwarza era visualnych.

Praktyczne use case dla biznesu

Co realnie robię w Midjourney dla klientów i siebie w 2026:

Featured images dla bloga: 90 procent grafik w naszych artykułach na seomantyczny.pl pochodzi z Midjourney. Format --ar 16:9, styl photorealistic albo flat vector zależnie od tematu. Czas: 5 minut per grafika z iteracjami.

Mockupy produktowe dla e-commerce: zdjęcia produktu w „lifestyle” otoczeniu (kosmetyk w łazience, świeca w salonie) bez kosztownej sesji fotograficznej. Działa dla 80 procent wizualizacji, ostatnie 20 procent trzeba mieć real foto.

Hero images dla landing pages: jeden custom hero zamiast generic Unsplash photo daje natychmiast bardziej premium feeling. Format --ar 16:9 albo --ar 21:9, styl raw.

Headery social media: Instagram (1:1), LinkedIn (1.91:1), YouTube thumbnails (16:9). Konsystentny brand visual bez zatrudniania designera.

Concept art dla projektów: szybki mockup pomysłu (interior design, packaging design, branding) zanim zatrudni się real designera. Przyspiesza początkową fazę o tygodnie.

Czego nie robię: zdjęcia produktów do sklepu (real foto plus AI cleanup), zdjęcia ludzi do kampanii marketingowych (komplikacje prawne i etyczne), grafiki, gdzie liczy się exact typography (Midjourney nie radzi sobie z tekstem).

Polskie znaki i kontekst

Midjourney nie ma polskiego interface, ale prompty po polsku działają, choć są wyraźnie gorsze niż angielskie. Model był trenowany głównie na anglojęzycznych captioned datasets, więc rozumie angielski 5 do 10 razy lepiej. Praktyczna zasada: pisz prompty po angielsku, nawet jeśli polski znasz lepiej.

Polskie elementy (typowe ubrania góralskie, polska architektura wiejska, polskie samochody) generuje słabo. „Polish farmhouse” daje generycznie wschodnioeuropejską stodołę, „goral folklore costume” daje cokolwiek ludowo-słowiańskiego. Dla konkretnych polskich kontekstów lepiej dorzucić specyfikę: „wooden cottage with red roof and white walls, hilly mountain landscape, eastern european countryside”.

Z kategorii „nie działa”: polski tekst na obrazach (Midjourney nie umie pisać po polsku, nawet pojedynczych słów), polskie marki/logos (oczywiście, copyright filter), polskie postaci historyczne (rzadko trenowane).

Cennik i kiedy się opłaca

Cztery plany Midjourney w 2026 (z roczną subskrypcją 20 procent rabatu, podaję ceny miesięczne):

Plan Cena/mc Fast hours Generacje fast (szac.) Komu pasuje
Basic 10 USD 3,3h fast ~200 generacji 4 obrazów Hobbystyczne, testowe
Standard 30 USD 15h fast + unlimited relax ~900 fast + nielimitowane relax Większość użytkowników
Pro 60 USD 30h fast + stealth mode ~1800 fast generacji Power-userzy, agencje
Mega 120 USD 60h fast + stealth + advanced ~3600 fast generacji Pełnoetatowi AI creators

„Fast hours” to godziny GPU dla szybkich generacji (30 do 60 sekund na 4 obrazy). „Relax mode” to wolniejsza kolejka (2 do 10 minut), dostępna tylko w Standard plus. „Stealth mode” w Pro/Mega znaczy, że twoje generacje nie są publiczne na midjourney.com (default jest publiczne, każdy widzi twoje obrazy).

Najczęstszy wybór: Standard 30 USD/mc dla 95 procent użytkowników. Daje wystarczająco fast hours do typowej pracy plus unlimited relax dla eksperymentów. Basic 10 USD jest za mały dla regularnej pracy (200 generacji na miesiąc kończy się szybko). Pro/Mega tylko dla zawodowych użytkowników, którzy generują 100 plus obrazów dziennie.

Prawa autorskie i komercyjne użycie

To pytanie pojawia się zawsze. Krótka odpowiedź dla planów płatnych: tak, możesz używać komercyjnie grafik z Midjourney, jeśli masz aktywną subskrypcję (Basic plus). Free trial nie pozwala na komercyjne użycie. Firmy z obrotem rocznym powyżej 1 miliona USD muszą mieć plan Pro lub Mega.

Długa odpowiedź jest bardziej skomplikowana. Prawnie obraz wygenerowany przez AI nie jest objęty copyright w wielu jurysdykcjach (US Copyright Office: tylko obrazy wygenerowane z udziałem człowieka mogą być copyrighted). W praktyce: używaj komercyjnie, ale traktuj jako stock photography z restrykcjami (nie nadaje się do logo, nie nadaje się do high-stakes brandingu, świetne do contentu).

Etyka: Midjourney trenowane było na publicznych obrazach z internetu, część z nich była objęta copyright. Trwają procesy sądowe (Getty Images vs Stability AI, similar przeciwko MJ). Dla większości komercyjnych use case (blog images, landing pages, social media) ryzyko prawne jest minimalne. Dla logo, packaging, brandingu raczej trzymaj się tradycyjnego designera.

Alternatywy, gdy Midjourney nie wystarczy

Midjourney jest najbardziej fotorealistyczny, ale nie zawsze najlepszy. Kiedy stosuję inne narzędzia:

DALL-E 3 (w ChatGPT Plus, 20 USD/mc): świetny dla obrazów wymagających dokładnego rozumienia złożonego promptu. „Wygeneruj obraz tatry, w środku odpoczywający turysta w czerwonej kurtce, na pierwszym planie po lewej drewniana tabliczka z napisem TRASA”. DALL-E rozumie każdy element, Midjourney miesza.

Stable Diffusion XL (lokalnie albo przez Replicate): gdy potrzebuję pełnej kontroli (custom modele, LoRA, ControlNet dla pozy/composition). Wymaga GPU (RTX 3060 plus) lub płatnego cloud (Replicate od 0.05 USD per obraz).

Flux 1.1 Pro: nowy konkurent z 2024 (od Black Forest Labs, byłych Stability AI), wyróżnia się lepszym renderingiem tekstu (Midjourney nadal nie umie pisać). Dostępny przez Replicate, Together.ai.

Imagen 3 (Google): w Workspace albo Vertex AI. Dobry dla użytkowników już w ekosystemie Google. Zobacz nasz porównanie Google Workspace vs Microsoft 365 dla kontekstu pakietowego.

Nie ma jednego „najlepszego” generatora. Profesjonalni twórcy AI używają 3 do 5 narzędzi naprzemiennie, wybierając per zadanie.

Najczęstsze błędy początkujących

1. Pisanie promptów po polsku. Działa, ale wyniki są znacznie gorsze. Zawsze po angielsku.

2. Zbyt długie prompty. Midjourney wagi słów malejąco od początku, więc 200-słowowy prompt rozcieńcza znaczenie kluczowych elementów. Optymalna długość: 20 do 50 słów.

3. Sprzeczne wskazówki w promptcie. „Photorealistic illustration with cartoon vibes” daje zlepek. Wybierz jeden styl.

4. Brak negative promptu. Bez --no text, watermark, blurry regularnie dostajesz obrazy z dziwnym tekstem albo znakiem wodnym.

5. Generowanie raz, frustracja, rezygnacja. Midjourney to gra w iteracje. Pierwszy prompt rzadko daje najlepszy wynik. Vary subtle/strong, Remix, dorzucanie parametrów. 5 do 10 iteracji to norma.

6. Próby wymuszenia tekstu. Midjourney nadal źle pisze tekst (nawet V7). Dla obrazów z tekstem (postery, infografiki) generuj obraz bez tekstu, dodaj tekst potem w Figmie/Photoshopie/Canva.

7. Strach przed AI obrazami w komercyjnym contentcie. Świat ruszył naprzód. Stock photography zostaje, ale AI obrazy są mainstreamem. Klient pyta „czy to AI?” raz na 50 grafik, i zazwyczaj nie ma znaczenia odpowiedzi.

Najczęściej zadawane pytania

Czy Midjourney jest darmowy?

Nie. Midjourney zakończył free trial w 2023 z powodu nadużyć (deepfakes). Najtańszy plan Basic kosztuje 10 USD miesięcznie (8 USD przy rocznej subskrypcji). Daje ~200 generacji „fast mode” miesięcznie.

Darmowe alternatywy: Stable Diffusion (lokalnie na własnym GPU), Imagen 3 w cenie Google Workspace, DALL-E 2 (limit 50 generacji/mc w Bing Image Creator). Jakość niższa niż Midjourney, ale bezpłatne.

Discord czy web app: co jest lepsze?

Web app (alpha.midjourney.com) jest wygodniejszy dla większości użytkowników w 2026: lepszy interface, łatwe parametrowanie przez sliders, organizacja historii, łatwe pobieranie. Discord nadal działa równolegle, niektórzy power-userzy preferują go za szybkość typowania promptów.

Dla nowych użytkowników zacznij od web app. Discord ma sens, jeśli generujesz dziesiątki obrazów dziennie i preferujesz klawiaturowy workflow.

Czy mogę używać obrazów z Midjourney komercyjnie?

Tak, jeśli masz aktywną subskrypcję Basic (10 USD/mc) plus. Firmy z obrotem rocznym powyżej 1 mln USD muszą mieć Pro lub Mega. Generacje z trial nie mogą być używane komercyjnie.

Prawnie obrazy AI nie są w pełni chronione copyright (US Copyright Office wymaga „human authorship”). Można ich używać do bloga, landing pages, social media, mockupów. Dla logo, packaging, high-stakes brandingu lepiej traditional designer.

Czy V7 zastąpił V6?

V7 jest defaultem od końca 2025 i jest lepszy od V6 w 90 procent zastosowań (fotorealizm, ręce, twarze, lighting). Wszystko, czego nauczyłeś się o promptingu w V6, transferuje się 1:1 do V7.

V6 nadal dostępny przez parametr --v 6, używany czasem dla artystycznych styli, w których V7 jest „za bardzo realistyczny” (np. surrealistyczne ilustracje, niektóre vintage style).

Dlaczego moje generacje nie wyglądają jak na pinterest?

Trzy główne powody: 1. Prompt jest za prosty (musisz dodać style, lighting, composition). 2. Generujesz po polsku zamiast angielsku. 3. Nie używasz parametrów (–ar, –style raw, –no text).

Najszybsza droga do lepszych wyników: skopiuj realne prompty z midjourney.com (publiczne galerii), zobacz strukturę, ucz się ich. Po 50 do 100 iteracjach intuicyjnie wiesz, jakie elementy działają w jakich kontekstach.

Czy Midjourney rozumie polski?

Tak, prompty po polsku działają, ale wyniki są wyraźnie gorsze niż angielskie. Model był trenowany głównie na anglojęzycznych captioned datasets, rozumie angielski 5 do 10 razy lepiej.

Praktyczna zasada: zawsze pisz prompty po angielsku, nawet jeśli polski znasz lepiej. Słowa kluczowe pamiętaj (photorealistic, soft natural light, shallow depth of field, cinematic) i dorzucaj do każdego promptu adekwatnie do potrzeb.

Ile kosztuje miesięczna praca w Midjourney?

Standardowy plan 30 USD (~120 zł netto) miesięcznie wystarczy dla typowego twórcy contentu generującego do 50 obrazów dziennie. To około 1500 generacji 4 obrazów miesięcznie w fast mode plus unlimited relax mode dla eksperymentów.

Dla agencji z 3 do 10 designerów wystarczy 1 Pro plan (60 USD), bo można współdzielić konto. Dla pełnoetatowego AI creatora generującego setki obrazów dziennie Mega 120 USD (~480 zł) plus dodatkowe fast hours przy potrzebie.

Czy Midjourney umie generować tekst na obrazach?

Słabo. V7 jest lepszy niż V6, ale nadal nie nadaje się do precyzyjnego tekstu. Pojedyncze słowa (logo) udają się w 30 procentach, dłuższe zdania prawie nigdy. Polski tekst praktycznie nigdy.

Dla obrazów z tekstem (postery, infografiki, social media) najlepsza praktyka: generuj obraz bez tekstu w Midjourney, dodaj tekst potem w Figmie, Canva, Photoshopie. Flux 1.1 Pro lepiej radzi sobie z tekstem, jeśli go potrzebujesz natywnie w generacji.

Picture of Tomasz Zieliński
Tomasz Zieliński

Tomasz zajmuje się tematyką SEO, sztucznej inteligencji i automatyzacji pracy w marketingu internetowym. W swoich artykułach analizuje zmiany w algorytmach wyszukiwarek, rozwój narzędzi AI oraz nowe sposoby tworzenia i optymalizacji treści. Interesuje go przede wszystkim to, jak technologia wpływa na codzienną pracę specjalistów SEO, marketerów i twórców internetowych.

Facebook
Twitter
LinkedIn
Pinterest

Najnowsze Wpisy

Śledź nas