Inconsistente kleurnamen matchen
Uit de steekproef van records in de tabel parking_violation blijkt dat de waarden van vehicle_color niet consistent zijn. Zo worden 'GRY', 'GRAY' en 'GREY' allemaal gebruikt om een grijze auto te beschrijven. Om deze kleur consequent weer te geven, is het handig om één enkele waarde te gebruiken. Gelukkig kun je de functie DIFFERENCE() gebruiken om dit voor elkaar te krijgen.
In deze oefening gebruik je de functie DIFFERENCE() om records op te halen die een vehicle_color-waarde bevatten die sterk lijkt op de string 'GRAY'. De module fuzzystrmatch is al voor je ingeschakeld.
Deze oefening maakt deel uit van de cursus
Data opschonen in PostgreSQL-databases
Oefeninstructies
- Gebruik de functie
DIFFERENCE()omparking_violation-records te vinden met eenvehicle_colorwaarvan de Soundex-code overeenkomt met de Soundex-code voor'GRAY'. Onthoud dat de functieDIFFERENCE()stringwaarden (niet Soundex-codes) als parameterargumenten accepteert.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
SELECT
summons_number,
vehicle_color
FROM
parking_violation
WHERE
-- Match SOUNDEX codes of vehicle_color and 'GRAY'
___(___, ___) = ___;