1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Cleaning Data in PostgreSQL Databases

Connected

Cvičení

Maskování identifikačních údajů pomocí regulárních výrazů

Regulární výrazy lze také použít k nahrazování vzorů v řetězcích pomocí funkce REGEXP_REPLACE(). Tato funkce je podobná funkci REPLACE() a má následující signaturu: REGEXP_REPLACE(source, pattern, replace, flags).

  • pattern je vzor, který se hledá ve zdrojovém řetězci source.
  • replace je náhradní řetězec, který se použije místo nalezeného vzoru.
  • flags je nepovinný řetězec pro řízení porovnávání.

Například REGEXP_REPLACE(xyz, '\d', '_', 'g') nahradí každý číselný znak (\d) ve sloupci xyz podtržítkem (_). Příznak g ("global") zajistí, že se nahradí všechny výskyty.

Aby byla chráněna soukromí příjemců pokut za parkování v novém webovém přehledu, musí být všechna písmena ve sloupci plate_id nahrazena pomlčkou (-), která zakryje skutečné číslo SPZ.

Pokyny

100 XP
  • Pomocí funkce REGEXP_REPLACE() nahraď všechna velká písmena (A až Z) ve sloupci plate_id znakem pomlčky (-), aby bylo možné v přehledu používat maskovaná čísla SPZ.