Čo je to Regex a ako funguje regulárny výraz?
Praktické použitie v GA4, Google Tag Manageri a Data Studio (návody + príklady).
Regex (skratka pre regular expression, teda regulárny výraz) je špeciálny jazyk určený na vyhľadávanie a manipuláciu s textom na základe vzorov. Pomocou regexu dokážete rýchlo nájsť konkrétne slová, čísla alebo formáty (napríklad e-mailové adresy, telefónne čísla či dátumy) bez nutnosti ručného prechádzania textu.
Funguje na princípe vytvorenia vzoru, ktorý sa porovnáva s textom a vracia všetky zhody. Výhodou je, že tento princíp je univerzálny – môžete ho použiť v rôznych nástrojoch, programovacích jazykoch a analytických platformách.
A nielen v programovaní, ale aj pri práci s databázami sa bez neho pri vytváraní zložitejších výberov či filtrov nezaobídete. Poďme sa teda pozrieť v rýchlosti, ako to funguje.
Základné symboly v Regexe a ich význam
-
- Pipe symbol ( | ) – funguje ako logický ALEBO operátor. Príklad: jablko|banán vyhľadá buď „jablko“, alebo „banán“.
- Bodka ( . ) – zodpovedá akémukoľvek znaku okrem znaku nového riadku. Príklad: h.t vyhľadá „hat“, „hit“, „hot“…
- Hviezdička (*) hovorí, že predchádzajúci znak sa nemusí vyskytnúť vôbec alebo sa opakuje viackrát Príklad: ho*t vyhľadá „ht“, „hot“, „hoot“…
- Strecha ( ^ ) – označuje začiatok riadku. Príklad: ^jablko vyhľadá reťazce, ktoré začínajú slovom „jablko“
- Dolár ( $ ) – označuje koniec riadku. Príklad: apple$ vyhľadá reťazce, ktoré končia slovom „apple“.
- Opačná lomka ( \ ) slúži na „escapovanie“ špeciálnych znakov – teda na zrušenie ich špeciálneho významu v regexe. Príklad: \. vyhľadá bodku.
Ako používať regex v Google Analytics 4
V GA4 použijete regex pri filtroch, segmentoch a publikách (operátor matches regex) na presné zahrnutie/vylúčenie URL, udalostí či kampaní.
Dôležité je povedať že GA4 používa RE2 – nepodporuje lookaround (lookahead/lookbehind) ani backreferences.
Príklad publika pre stránky s detailom produktu:
- Otvorte Audiences.
- Vytvorte nový Audience.
- Zvoľte dimenziu (napr. Page path).
- Operátor matches regex → zadajte vzor → uložte.
Vzor regexu ^/produkt/[A-Za-z0-9-]{5,}
Ako to funguje? Zahrnie len návštevy, kde Page path začína „/produkt/“ a nasleduje aspoň 5-znakové alfanumerické ID (napr. /produkt/ABC-123). Tento regex sa hodí na tvorbu publík „záujem o konkrétne produkty“.
Ako používať regex v Google Tag Manageri
V GTM sa regex využíva v spúšťačoch (triggers) a premenných (variables), aby sa tagy spúšťali len pri presne definovaných podmienkach.
Príklad triggeru len pre kliknutia na e-mail:
- Trigger: Click → Links → Some link clicks.
- Podmienka: Click URL→ matches RegEx.
- Vzor → uložiť → priradiť k tagu.
Vzor regexu ^mailto:
Ako to funguje? Tag sa spustí iba pri kliknutí na odkaz typu „napísať e-mail“ (href začína mailto:).
Ako používať regex v Data Studio
V Data Studio sa regex hodí do filtrov aj do calculated fields (REGEXP_MATCH, REGEXP_EXTRACT, prípadne REGEXP_REPLACE) na presné triedenie, pomenovanie a čistenie dát. Prakticky tak viete zoskupiť URL do kategórií, vytiahnuť UTM parametre alebo z adresy odstrániť všetko od ? ďalej, aby ste porovnávali metriky na „čistých“ URL a report sa dal lepšie segmentovať.
Tip: Regex je v Data Studio case-sensitive. Buď normalizujte text cez LOWER()/UPPER(), alebo použite alternácie v regexe. Pri väčších reportoch vytvorte jedno calculated field a používajte ho naprieč grafmi kvôli výkonu.
Príklad očistenia URL od parametrov:
- Data → Add a field → Add calculated field.
- Názov: Page (bez parametrov) → Vzorec.
- V grafoch nahraďte pôvodné pole Page novým poľom „Page (bez parametrov)”.
Vzor regexu REGEXP_REPLACE(Page location, „\?.*$“, „“)
Ako to funguje? Nové pole vychádza z dimenzie Page location, ale z adresy odstráni časť od znaku ? až po koniec. Získate tak čistú URL bez UTM a ďalších parametrov, takže údaje za tú istú stránku sa spočítajú dokopy namiesto rozdelenia na viacero verzií.
Je treba poznať regulárne výrazy v dobe umelej inteligencie?
Aj v ére AI má Regex svoje pevné miesto. Kým umelá inteligencia dokáže chápať kontext a význam, regulárne výrazy ponúkajú rýchlosť, presnosť a predvídateľnosť, ideálne na čistenie a prípravu dát. V praxi sa preto skvelo dopĺňajú: Regex odstráni šum, identifikuje e-maily či čísla objednávok a AI potom dokáže dáta interpretovať a využiť. Výsledkom je efektívna kombinácia „skalpelu“ a „mozgu“, ktorá robí spracovanie textu rýchlejším aj presnejším.
Záver
Regex je mimoriadne užitočný nástroj, ktorý v Google Analytics 4, Google Tag Manageri a Data Studiu pomáha presne filtrovať, čistiť a zoskupovať dáta bez zbytočného manuálneho zásahu. Ovládnutím základných vzorov získate jasnejší pohľad na výkonnosť webu, odhalíte skryté súvislosti a pripravíte prehľadnejšie reporty. V našej agentúre pracujeme s analytikou a dátami každý deň, preto ak vás zaujímajú praktické tipy, prečítajte si aj ďalšie články na túto tému.




+ Diskusia nemá žiadne príspevky