1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Cleaning Data in PostgreSQL Databases

Connected

Cvičení

Detekce neplatných hodnot pomocí regulárních výrazů

Ve videu jsme viděli, že existuje několik způsobů, jak odhalit neplatné hodnoty v datech. V tomto cvičení použijeme regulární výrazy k identifikaci záznamů s neplatnými hodnotami v tabulce parking_violation.

Dva vzory regulárních výrazů, které se ti v tomto cvičení budou hodit, jsou c{n} a c+. c{n} odpovídá řetězcům, které obsahují znak c opakovaný n-krát. Například x{4} odpovídá vzoru xxxx. c+ odpovídá řetězcům, které obsahují znak c opakovaný jednou nebo vícekrát. Tento vzor by odpovídal řetězcům jako xxxx, ale také x nebo xx.

Pokyny 1/3

undefined XP
  • 1
    • Napiš dotaz vracející záznamy, jejichž registration_state neodpovídá dvěma po sobě jdoucím písmenům velké abecedy.
  • 2
    • Napiš dotaz vracející záznamy, jejichž plate_type neodpovídá třem po sobě jdoucím písmenům velké abecedy.
  • 3
    • Napiš dotaz vracející záznamy, jejichž vehicle_make neobsahuje velké písmeno, lomítko (/) ani mezeru (\s).