Appliquer des fonctions pour nettoyer des chaînes
Tout au long de ce cours, nous utiliserons un ensemble de données contenant 5 000 infractions de stationnement à New York, stockées dans la table parking_violation.
Un service qui fournit une version papier de l’avis d’infraction est en cours de refonte. Pour que les informations s’impriment correctement sur le rapport, certains champs doivent être adaptés par rapport à leur représentation dans la base de données. Les changements à effectuer sont les suivants :
- Pour aligner correctement le texte sur le formulaire, les valeurs de
violation_locationdoivent comporter 4 caractères. - Toutes les valeurs
P-U(pick-up truck) dans la colonnevehicle_body_typedoivent être remplacées par la valeur génériqueTRK. - Seule la première lettre de chaque mot de la colonne
street_namedoit être en majuscules.
Les fonctions LPAD(), REPLACE() et INITCAP() seront utilisées pour appliquer ces modifications.
Cet exercice fait partie du cours
Nettoyer des données dans des bases PostgreSQL
Instructions
- Ajoutez
'0'au début de toute valeurviolation_locationdont la longueur est inférieure à 4 chiffres à l’aide de la fonctionLPAD(). - Remplacez
'P-U'par'TRK'dans les valeurs de la colonnevehicle_body_typeà l’aide de la fonctionREPLACE(). - Assurez-vous que seule la première lettre des mots dans la colonne
street_nameest en majuscules à l’aide de la fonctionINITCAP().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
SELECT
-- Add 0s to ensure violation_location is 4 characters in length
___(___, ___, ___) AS violation_location,
-- Replace 'P-U' with 'TRK' in vehicle_body_type column
___(___, ___, ___) AS vehicle_body_type,
-- Ensure only first letter capitalized in street_name
___(___) AS ___
FROM
parking_violation;