CommencerCommencer gratuitement

Uniformiser les formats de vols I

Le nettoyage des données est essentiel, car il arrive souvent de récupérer des données désordonnées qui ne sont pas prêtes à être analysées.

Dans cet exercice, vous devez récupérer tous les enregistrements avec plus de 100 retards depuis la table flight_statistics. Dans une colonne unique, vous devez concaténer carrier_code, registration_code et airport_code, avec un format similaire à celui-ci : "AA - 000000119, JFK".

En analysant la table flight_statistics, vous constatez que certaines valeurs de registration_code ont des formats différents. Un registration_code correct doit comporter neuf chiffres ; s’il en a moins, vous devez le compléter avec des zéros en tête.

Pour cela, vous pouvez utiliser la fonction REPLICATE() en combinaison avec LEN() et CONCAT().

Cet exercice fait partie du cours

Nettoyer des données dans des bases SQL Server

Afficher le cours

Instructions

  • Utilisez la fonction appropriée pour concaténer les colonnes carrier_code, les zéros en tête avant un code d’immatriculation, registration_code et airport_code.
  • Répliquez autant de zéros que nécessaire en soustrayant 9 de la longueur de chaque registration_code.
  • Filtrez les enregistrements où la colonne delayed est supérieure à 100.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

SELECT 
	-- Concat the strings
	___(
		carrier_code, 
		' - ', 
      	-- Replicate zeros
		___('___', 9 - ___(registration_code)), 
		registration_code, 
		', ', 
		airport_code)
	AS registration_code
FROM flight_statistics
-- Filter registers with more than 100 delays
WHERE ___ > 100
Modifier et exécuter le code