Ongeldige waarden detecteren met reguliere expressies
In de video-oefening zagen we dat er verschillende manieren zijn om ongeldige waarden in onze gegevens op te sporen. In deze oefening gebruiken we reguliere expressies om records met ongeldige waarden in de tabel parking_violation te identificeren.
Een paar regexpatronen die handig zijn in deze oefening zijn c{n} en c+. c{n} matcht tekenreeksen waarin het teken c precies n keer herhaald wordt. Bijvoorbeeld, x{4} matcht het patroon xxxx. c+ matcht tekenreeksen waarin het teken c één of meer keer herhaald wordt. Dit patroon zou reeksen matchen zoals xxxx, maar ook x en xx.
Deze oefening maakt deel uit van de cursus
Data opschonen in PostgreSQL-databases
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
SELECT
summons_number,
plate_id,
registration_state
FROM
parking_violation
WHERE
-- Define the pattern to use for matching
___ ___ ___ ___ ___;