Faire correspondre des noms de couleurs incohérents
À partir de l’échantillon d’enregistrements de la table parking_violation, il est clair que les valeurs de vehicle_color ne sont pas cohérentes. Par exemple, 'GRY', 'GRAY' et 'GREY' sont toutes utilisées pour décrire un véhicule gris. Pour représenter cette couleur de manière uniforme, il est préférable d’utiliser une seule valeur. Heureusement, la fonction DIFFERENCE() permet d’atteindre cet objectif.
Dans cet exercice, vous allez utiliser DIFFERENCE() pour retourner les enregistrements dont la valeur vehicle_color correspond étroitement à la chaîne 'GRAY'. Le module fuzzystrmatch a déjà été activé pour vous.
Cet exercice fait partie du cours
Nettoyer des données dans des bases PostgreSQL
Instructions
- Utilisez la fonction
DIFFERENCE()pour trouver les enregistrements deparking_violationdontvehicle_colora un code Soundex qui correspond au code Soundex de'GRAY'. Rappelez-vous queDIFFERENCE()accepte des valeurs de type chaîne (et non des codes Soundex) comme arguments de paramètres.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
SELECT
summons_number,
vehicle_color
FROM
parking_violation
WHERE
-- Match SOUNDEX codes of vehicle_color and 'GRAY'
___(___, ___) = ___;