Raport skuteczności w Search Console, 40 tysięcy fraz. Chcesz zobaczyć tylko pytania – te wszystkie „jak”, „dlaczego”, „ile kosztuje” – bo z nich powstaje plan na FAQ i nowe artykuły. Klikanie filtrów „zawiera” zajmie pół godziny i i tak coś pominiesz. Jedno wyrażenie regularne robi to w trzy sekundy. To jest dokładnie ten moment, w którym regex przestaje być „czymś dla programistów”.
Spis treści
ToggleCzym są wyrażenia regularne
Wyrażenie regularne (regex) to wzorzec opisujący tekst. Zamiast szukać konkretnego słowa, opisujesz regułę: „fraza zaczynająca się od «jak»”, „adres URL zawierający /blog/ i kończący się ukośnikiem”, „dowolny ciąg ośmiu lub więcej słów”. Silnik regex porównuje wzorzec z każdą frazą czy adresem i zwraca dopasowania.
W SEO regex spotkasz w pięciu miejscach: filtrach Search Console, filtrach i odbiorcach GA4, regułach Google Tag Managera, konfiguracji crawlerów typu Screaming Frog oraz przekierowaniach w .htaccess. Składnia jest wszędzie niemal identyczna – nauczone raz, działa wszędzie.
Minimalna składnia, która załatwia 90% przypadków
Pełna dokumentacja regex potrafi przytłoczyć, ale do pracy z frazami i adresami wystarczy ten zestaw:
| Znak | Znaczenie | Przykład |
|---|---|---|
^ |
początek tekstu | ^jak – frazy zaczynające się od „jak” |
$ |
koniec tekstu | cennik$ – frazy kończące się na „cennik” |
| |
lub | cena|koszt|cennik – dowolne z trzech słów |
. |
dowolny pojedynczy znak | se. – „seo”, „sen”, „ser” |
* |
zero lub więcej powtórzeń | .* – cokolwiek, dowolnej długości |
+ |
jedno lub więcej powtórzeń | \s+ – co najmniej jedna spacja |
() |
grupa | ^(jak|czy|ile) – początek z jednym z trzech słów |
\d / \s / \w |
cyfra / spacja / znak słowa | \d{4} – rok, np. 2026 |
{n,} |
minimum n powtórzeń | (\S+\s+){7,} – frazy od 8 słów wzwyż |
Jedna zasada bezpieczeństwa: kropka znaczy „dowolny znak”, więc szukając dosłownej kropki (np. w „strona.pl”), poprzedź ją ukośnikiem: strona\.pl. To samo dotyczy znaków +, ? i nawiasów.
Regex w Google Search Console
W raporcie skuteczności dodajesz filtr zapytania lub adresu i wybierasz z listy „Niestandardowe (wyrażenie regularne)”. Do wyboru masz dwa tryby: „pasuje do wyrażenia” i „nie pasuje” – ten drugi bywa nawet cenniejszy, bo pozwala wykluczać.
Trzy szczegóły, które oszczędzają nerwy. Search Console używa silnika RE2 i dopasowuje częściowo – wzorzec buty złapie też „najlepsze buty zimowe”. Dopasowanie rozróżnia wielkość liter, więc na początku wzorca warto dopisać (?i), które ją wyłącza. A limit długości wyrażenia to 4096 znaków – wystarczy nawet na bardzo długie listy słów brandowych.
Gotowe wzorce do skopiowania:
^(?i)(jak|co|czy|dlaczego|ile|kiedy|gdzie|który|jaka|jakie)\s – wszystkie frazy pytaniowe. Z tej listy powstają sekcje FAQ i tematy artykułów, a skoro pytania są już w raporcie, to znaczy, że Google pokazuje Cię na nie choć trochę.
(?i)(seomantyczny|seo mantyczny|seomantyczny\.pl) – ruch brandowy. Ten sam wzorzec w trybie „nie pasuje” daje czysty ruch niebrandowy, czyli realny efekt pozycjonowania. To jeden z pierwszych filtrów przy każdej analizie słów kluczowych.
^(?:\S+\s+){7,}\S+$ – frazy z co najmniej ośmiu słów, czyli long tail. Celowo \S zamiast \w: w silniku RE2 \w obejmuje tylko znaki ASCII, więc „ż”, „ą” czy „ś” przerwałyby dopasowanie polskich fraz. Zwykle siedzą tam zapytania z pozycji 8-20, które jeden akapit uzupełnienia treści potrafi wciągnąć do top 5. Jak systematycznie pracować z pozycjami, opisujemy w tekście o sprawdzaniu pozycji strony w Google.
Jeśli dopiero konfigurujesz usługę, zacznij od prawidłowych ustawień Search Console – filtry regex działają na danych, które usługa zbiera od momentu weryfikacji.
Regex w GA4 i Google Tag Managerze
Tu czeka najczęstsza pułapka całego tematu. GA4 w wielu miejscach dopasowuje regex do całości tekstu, nie częściowo jak Search Console. Wzorzec blog, który w GSC łapał wszystko ze słowem „blog”, w filtrze GA4 dopasuje wyłącznie tekst będący dokładnie słowem „blog”. Chcesz „zawiera”? Pisz .*blog.*. Połowa „zepsutych” regexów w GA4 to dokładnie ten błąd.
W Google Tag Managerze regex pojawia się w warunkach reguł („pasuje do wyrażenia regularnego”) i w zmiennych typu tabela wyrażeń regularnych. Klasyczne użycie: jeden tag uruchamiany na grupie adresów /koszyk/|/zamowienie/|/platnosc/ zamiast trzech osobnych reguł. Podstawy konfiguracji zebraliśmy w poradniku o Google Tag Managerze.
Regex w crawlerach i przekierowaniach
Screaming Frog przyjmuje regex w trzech kluczowych miejscach: include (crawluj tylko pasujące adresy), exclude (omiń pasujące) i custom extraction. Przy dużym sklepie include .*/kategoria/.* potrafi skrócić crawl z godzin do minut, a exclude .*\?(sort|filter|page)=.* wycina nieskończone kombinacje parametrów filtrowania.
Drugie zastosowanie to migracje. Reguła w .htaccess w stylu RedirectMatch 301 ^/blog/(\d{4})/(.*)$ /blog/$2 przepisuje całą starą strukturę adresów z datami na nową jedną linijką, zamiast tysiąca pojedynczych przekierowań. Z tą mocą idzie odpowiedzialność: błędny wzorzec w .htaccess psuje adresy na całej witrynie naraz, więc każdą regułę testuj najpierw na liście przykładowych URL-i.
RE2 – czego narzędzia Google nie obsługują
Wpisujesz w GSC wzorzec z internetu, a filtr zwraca błąd albo zero wyników? W 9 przypadkach na 10 winowajcą jest lookahead lub lookbehind – konstrukcje typu (?!...) i (?<=...). Silnik RE2, którego używają Search Console i GA4, celowo ich nie wspiera (podobnie jak odwołań wstecznych), bo gwarantuje za to przewidywalną szybkość na ogromnych zbiorach danych.
Dobra wiadomość: w filtrach prawie nigdy nie są potrzebne. Negację załatwia tryb „nie pasuje do wyrażenia” – zamiast karkołomnego ^(?!.*brand).*$ piszesz zwykłe brand i przełączasz filtr na wykluczanie. Prościej, czytelniej i działa.
Jak testować regex bez ryzyka
Nie testuj na żywym .htaccess ani nie zgaduj w GSC. Wklej wzorzec na regex101.com, w lewym panelu przełącz silnik (flavor) na „Golang” – to składnia najbliższa RE2 – a w polu testowym umieść 20-30 prawdziwych fraz wyeksportowanych z Search Console. Podświetlenia natychmiast pokażą, co łapiesz, a czego nie, i dlaczego.
Dwie minuty takiego testu oszczędzają godzinę debugowania. A przetestowane wzorce zapisuj – biblioteka pięciu-sześciu sprawdzonych regexów (pytania, brand, long tail, parametry, sekcje serwisu) pokrywa praktycznie wszystkie powtarzalne analizy.
Najczęściej zadawane pytania
Co to są wyrażenia regularne?
To wzorce opisujące tekst – zamiast szukać konkretnego słowa, definiujesz regułę: „frazy zaczynające się od «jak»”, „adresy zawierające /blog/”. Silnik regex zwraca wszystko, co pasuje do reguły.
W SEO regex działa w Search Console, GA4, Google Tag Managerze, Screaming Frogu i przekierowaniach .htaccess.
Czy Google Search Console obsługuje regex?
Tak – w filtrach zapytania i adresu URL raportu skuteczności wybierz „Niestandardowe (wyrażenie regularne)”. Dostępne są tryby „pasuje” i „nie pasuje”, a limit długości wzorca to 4096 znaków.
GSC używa silnika RE2 z dopasowaniem częściowym i rozróżnianiem wielkości liter – wyłączysz je prefiksem (?i).
Dlaczego mój regex nie działa w Search Console?
Najczęstszy powód: wzorzec używa lookahead/lookbehind ((?!...), (?<=...)) albo odwołań wstecznych, których silnik RE2 nie obsługuje. Takie wyrażenia, kopiowane z internetu, w GSC zwracają błąd.
Negację zastąp trybem filtra „nie pasuje do wyrażenia” – załatwia to samo prostszym wzorcem.
Jak odfiltrować frazy brandowe od niebrandowych?
Zbuduj wzorzec z wariantami marki, np. (?i)(nazwa|nazwa firmy|nazwafirmy\.pl), i ustaw filtr zapytań na „pasuje” (ruch brandowy) albo „nie pasuje” (ruch niebrandowy). Ujmij literówki i zapis łączny oraz rozdzielny.
Ruch niebrandowy to podstawowa miara efektów pozycjonowania – brand rośnie głównie od rozpoznawalności, nie od SEO.
Czy regex w GA4 działa tak samo jak w Search Console?
Składnia jest ta sama (RE2), ale dopasowanie inne: GA4 w wielu miejscach wymaga dopasowania całego tekstu, podczas gdy GSC dopasowuje częściowo. Wzorzec blog w GSC łapie „mój blog firmowy”, w filtrze GA4 – tylko dokładnie „blog”.
W GA4 dla „zawiera” pisz .*blog.*. To najczęstsza przyczyna pozornie zepsutych filtrów.
Gdzie bezpiecznie testować wyrażenia regularne?
Na regex101.com – wklejasz wzorzec, przełączasz silnik na „Golang” (najbliższy RE2 używanemu przez Google) i testujesz na prawdziwych frazach wyeksportowanych z Search Console.
Reguły przekierowań testuj na liście przykładowych adresów przed wgraniem do .htaccess – błędny wzorzec psuje adresy całej witryny naraz.






