Aan de slagGa gratis aan de slag

Inconsistente kleurnamen matchen

Uit de steekproef van records in de tabel parking_violation blijkt dat de waarden van vehicle_color niet consistent zijn. Zo worden 'GRY', 'GRAY' en 'GREY' allemaal gebruikt om een grijze auto te beschrijven. Om deze kleur consequent weer te geven, is het handig om één enkele waarde te gebruiken. Gelukkig kun je de functie DIFFERENCE() gebruiken om dit voor elkaar te krijgen.

In deze oefening gebruik je de functie DIFFERENCE() om records op te halen die een vehicle_color-waarde bevatten die sterk lijkt op de string 'GRAY'. De module fuzzystrmatch is al voor je ingeschakeld.

Deze oefening maakt deel uit van de cursus

Data opschonen in PostgreSQL-databases

Cursus bekijken

Oefeninstructies

  • Gebruik de functie DIFFERENCE() om parking_violation-records te vinden met een vehicle_color waarvan de Soundex-code overeenkomt met de Soundex-code voor 'GRAY'. Onthoud dat de functie DIFFERENCE() stringwaarden (niet Soundex-codes) als parameterargumenten accepteert.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

SELECT
  summons_number,
  vehicle_color
FROM
  parking_violation
WHERE
  -- Match SOUNDEX codes of vehicle_color and 'GRAY'
  ___(___, ___) = ___;
Code bewerken en uitvoeren