CommencerCommencer gratuitement

Appliquer des fonctions pour nettoyer des chaînes

Tout au long de ce cours, nous utiliserons un ensemble de données contenant 5 000 infractions de stationnement à New York, stockées dans la table parking_violation.

Un service qui fournit une version papier de l’avis d’infraction est en cours de refonte. Pour que les informations s’impriment correctement sur le rapport, certains champs doivent être adaptés par rapport à leur représentation dans la base de données. Les changements à effectuer sont les suivants :

  • Pour aligner correctement le texte sur le formulaire, les valeurs de violation_location doivent comporter 4 caractères.
  • Toutes les valeurs P-U (pick-up truck) dans la colonne vehicle_body_type doivent être remplacées par la valeur générique TRK.
  • Seule la première lettre de chaque mot de la colonne street_name doit être en majuscules.

Les fonctions LPAD(), REPLACE() et INITCAP() seront utilisées pour appliquer ces modifications.

Cet exercice fait partie du cours

Nettoyer des données dans des bases PostgreSQL

Afficher le cours

Instructions

  • Ajoutez '0' au début de toute valeur violation_location dont la longueur est inférieure à 4 chiffres à l’aide de la fonction LPAD().
  • Remplacez 'P-U' par 'TRK' dans les valeurs de la colonne vehicle_body_type à l’aide de la fonction REPLACE().
  • Assurez-vous que seule la première lettre des mots dans la colonne street_name est en majuscules à l’aide de la fonction INITCAP().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

SELECT
  -- Add 0s to ensure violation_location is 4 characters in length
  ___(___, ___, ___) AS violation_location,
  -- Replace 'P-U' with 'TRK' in vehicle_body_type column
  ___(___, ___, ___) AS vehicle_body_type,
  -- Ensure only first letter capitalized in street_name
  ___(___) AS ___
FROM
  parking_violation;
Modifier et exécuter le code