Uneinheitliche Farbnamen abgleichen
Anhand der Stichprobe von Datensätzen in der Tabelle parking_violation ist klar, dass die Werte in vehicle_color nicht einheitlich sind. Zum Beispiel werden 'GRY', 'GRAY' und 'GREY' alle verwendet, um ein graues Fahrzeug zu beschreiben. Um diese Farbe konsistent darzustellen, ist es sinnvoll, einen einzigen Wert zu verwenden. Glücklicherweise lässt sich dieses Ziel mit der Funktion DIFFERENCE() erreichen.
In dieser Übung verwendest du die Funktion DIFFERENCE(), um Datensätze zurückzugeben, deren vehicle_color-Wert eng mit dem String 'GRAY' übereinstimmt. Das Modul fuzzystrmatch wurde bereits für dich aktiviert.
Diese Übung ist Teil des Kurses
Datenbereinigung in PostgreSQL-Datenbanken
Anleitung zur Übung
- Verwende die Funktion
DIFFERENCE(), umparking_violation-Datensätze zu finden, derenvehicle_coloreinen Soundex-Code hat, der mit dem Soundex-Code für'GRAY'übereinstimmt. Denk daran, dass die FunktionDIFFERENCE()als Parameterargumente String-Werte (nicht Soundex-Codes) akzeptiert.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
SELECT
summons_number,
vehicle_color
FROM
parking_violation
WHERE
-- Match SOUNDEX codes of vehicle_color and 'GRAY'
___(___, ___) = ___;