Čo je to Regex a ako funguje regulárny výraz?


Čo je to Regex a ako funguje regulárny výraz?

Praktické použitie v GA4, Google Tag Manageri a Data Studio (návody + príklady).

 

Regex (skratka pre regular expression, teda regulárny výraz) je špeciálny jazyk určený na vyhľadávanie a manipuláciu s textom na základe vzorov. Pomocou regexu dokážete rýchlo nájsť konkrétne slová, čísla alebo formáty (napríklad e-mailové adresy, telefónne čísla či dátumy) bez nutnosti ručného prechádzania textu. 

Funguje na princípe vytvorenia vzoru, ktorý sa porovnáva s textom a vracia všetky zhody. Výhodou je, že tento princíp je univerzálny – môžete ho použiť v rôznych nástrojoch, programovacích jazykoch a analytických platformách.

A nielen v programovaní, ale aj pri práci s databázami sa bez neho pri vytváraní zložitejších výberov či filtrov nezaobídete. Poďme sa teda pozrieť v rýchlosti, ako to funguje.

Základné symboly v Regexe a ich význam

    • Pipe symbol ( | ) – funguje ako logický ALEBO operátor. Príklad: jablko|banán vyhľadá buď „jablko“, alebo „banán“.
    • Bodka ( . ) – zodpovedá akémukoľvek znaku okrem znaku nového riadku. Príklad: h.t vyhľadá „hat“, „hit“, „hot“…
    • Hviezdička (*) hovorí, že predchádzajúci znak sa nemusí vyskytnúť vôbec alebo sa opakuje viackrát Príklad: ho*t vyhľadá „ht“, „hot“, „hoot“…
    • Strecha ( ^ ) – označuje začiatok riadku. Príklad: ^jablko vyhľadá reťazce, ktoré začínajú slovom „jablko“
    • Dolár ( $ ) – označuje koniec riadku. Príklad: apple$ vyhľadá reťazce, ktoré končia slovom „apple“.
    • Opačná lomka ( \ ) slúži na „escapovanie“ špeciálnych znakov – teda na zrušenie ich špeciálneho významu v regexe. Príklad: \. vyhľadá bodku.
      Obrázok obsahuje ťahák základných znakov regexu

      Ťahák pre základné znaky regexu

Ako používať regex v Google Analytics 4

V GA4 použijete regex pri filtroch, segmentoch a publikách (operátor matches regex) na presné zahrnutie/vylúčenie URL, udalostí či kampaní.

Dôležité je povedať že  GA4 používa RE2 – nepodporuje lookaround (lookahead/lookbehind) ani backreferences.

Príklad publika pre stránky s detailom produktu:

  1. Otvorte Audiences.
  2. Vytvorte nový Audience.
  3. Zvoľte dimenziu (napr. Page path).
  4. Operátor matches regex → zadajte vzor → uložte.
    Obrázok zobrazuje postup nastavenia regexu v GA4

    Postup tvorby regexu v GA4

Vzor regexu ^/produkt/[A-Za-z0-9-]{5,}

Ako to funguje? Zahrnie len návštevy, kde Page path začína „/produkt/“ a nasleduje aspoň 5-znakové alfanumerické ID (napr. /produkt/ABC-123). Tento regex sa hodí na tvorbu publík „záujem o konkrétne produkty“.

Ako používať regex v Google Tag Manageri

V GTM sa regex využíva v spúšťačoch (triggers) a premenných (variables), aby sa tagy spúšťali len pri presne definovaných podmienkach.

Príklad triggeru len pre kliknutia na e-mail:

  1. Trigger: Click → Links → Some link clicks.
  2. Podmienka: Click URL→ matches RegEx.
  3. Vzor → uložiť → priradiť k tagu.
    Obrázok zobrazuje postup tvorby regexu pri GTM

    Postup tvorby regexu v GTM

Vzor regexu ^mailto:

Ako to funguje? Tag sa spustí iba pri kliknutí na odkaz typu „napísať e-mail“ (href začína mailto:).

Ako používať regex v Data Studio

V Data Studio sa regex hodí do filtrov aj do calculated fields (REGEXP_MATCH, REGEXP_EXTRACT, prípadne REGEXP_REPLACE) na presné triedenie, pomenovanie a čistenie dát. Prakticky tak viete zoskupiť URL do kategórií, vytiahnuť UTM parametre alebo z adresy odstrániť všetko od ? ďalej, aby ste porovnávali metriky na „čistých“ URL a report sa dal lepšie segmentovať.

Tip: Regex je v Data Studio case-sensitive. Buď normalizujte text cez LOWER()/UPPER(), alebo použite alternácie v regexe. Pri väčších reportoch vytvorte jedno calculated field a používajte ho naprieč grafmi kvôli výkonu.

Príklad očistenia URL od parametrov: 

  1. Data → Add a field → Add calculated field.
  2. Názov: Page (bez parametrov) → Vzorec.
  3. V grafoch nahraďte pôvodné pole Page novým poľom „Page (bez parametrov)”.
    Obrázok zobrazuje postup pri tvorbe regexu v Data Studio

    Postup tvorby regexu v Data Studio

Vzor regexu REGEXP_REPLACE(Page location, „\?.*$“, „“)

Ako to funguje? Nové pole vychádza z dimenzie Page location, ale z adresy odstráni časť od znaku ? až po koniec. Získate tak čistú URL bez UTM a ďalších parametrov, takže údaje za tú istú stránku sa spočítajú dokopy namiesto rozdelenia na viacero verzií.

Je treba poznať regulárne výrazy v dobe umelej inteligencie?

Aj v ére AI má Regex svoje pevné miesto. Kým umelá inteligencia dokáže chápať kontext a význam, regulárne výrazy ponúkajú rýchlosť, presnosť a predvídateľnosť, ideálne na čistenie a prípravu dát. V praxi sa preto skvelo dopĺňajú: Regex odstráni šum, identifikuje e-maily či čísla objednávok a AI potom dokáže dáta interpretovať a využiť. Výsledkom je efektívna kombinácia „skalpelu“ a „mozgu“, ktorá robí spracovanie textu rýchlejším aj presnejším.

Záver

Regex je mimoriadne užitočný nástroj, ktorý v Google Analytics 4, Google Tag Manageri a Data Studiu pomáha presne filtrovať, čistiť a zoskupovať dáta bez zbytočného manuálneho zásahu. Ovládnutím základných vzorov získate jasnejší pohľad na výkonnosť webu, odhalíte skryté súvislosti a pripravíte prehľadnejšie reporty. V našej agentúre pracujeme s analytikou a dátami každý deň, preto ak vás zaujímajú praktické tipy, prečítajte si aj ďalšie články na túto tému.

+ Diskusia nemá žiadne príspevky