CommencerCommencez gratuitement

Uniformiser les formats de vols I

Le nettoyage des données est essentiel, car il arrive souvent de récupérer des données désordonnées qui ne sont pas prêtes à être analysées.

Dans cet exercice, vous devez récupérer tous les enregistrements avec plus de 100 retards depuis la table flight_statistics. Dans une colonne unique, vous devez concaténer carrier_code, registration_code et airport_code, avec un format similaire à celui-ci : "AA - 000000119, JFK".

En analysant la table flight_statistics, vous constatez que certaines valeurs de registration_code ont des formats différents. Un registration_code correct doit comporter neuf chiffres ; s’il en a moins, vous devez le compléter avec des zéros en tête.

Pour cela, vous pouvez utiliser la fonction REPLICATE() en combinaison avec LEN() et CONCAT().

Cet exercice fait partie du cours

<cours>Nettoyer des données dans des bases SQL Server</cours>
Voir le cours

Instructions de l’exercice

  • Utilisez la fonction appropriée pour concaténer les colonnes carrier_code, les zéros en tête avant un code d’immatriculation, registration_code et airport_code.
  • Répliquez autant de zéros que nécessaire en soustrayant 9 de la longueur de chaque registration_code.
  • Filtrez les enregistrements où la colonne delayed est supérieure à 100.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

SELECT 
	-- Concat the strings
	___(
		carrier_code, 
		' - ', 
      	-- Replicate zeros
		___('___', 9 - ___(registration_code)), 
		registration_code, 
		', ', 
		airport_code)
	AS registration_code
FROM flight_statistics
-- Filter registers with more than 100 delays
WHERE ___ > 100
Modifier et exécuter le code