Aan de slagGa gratis aan de slag

Ongeldige waarden detecteren met reguliere expressies

In de video-oefening zagen we dat er verschillende manieren zijn om ongeldige waarden in onze gegevens op te sporen. In deze oefening gebruiken we reguliere expressies om records met ongeldige waarden in de tabel parking_violation te identificeren.

Een paar regexpatronen die handig zijn in deze oefening zijn c{n} en c+. c{n} matcht tekenreeksen waarin het teken c precies n keer herhaald wordt. Bijvoorbeeld, x{4} matcht het patroon xxxx. c+ matcht tekenreeksen waarin het teken c één of meer keer herhaald wordt. Dit patroon zou reeksen matchen zoals xxxx, maar ook x en xx.

Deze oefening maakt deel uit van de cursus

Data opschonen in PostgreSQL-databases

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

SELECT
  summons_number,
  plate_id,
  registration_state
FROM
  parking_violation
WHERE
  -- Define the pattern to use for matching
  ___ ___ ___ ___ ___;
Code bewerken en uitvoeren