Uniformiser les formats de vols I
Le nettoyage des données est essentiel, car il arrive souvent de récupérer des données désordonnées qui ne sont pas prêtes à être analysées.
Dans cet exercice, vous devez récupérer tous les enregistrements avec plus de 100 retards depuis la table flight_statistics. Dans une colonne unique, vous devez concaténer carrier_code, registration_code et airport_code, avec un format similaire à celui-ci : "AA - 000000119, JFK".
En analysant la table flight_statistics, vous constatez que certaines valeurs de registration_code ont des formats différents. Un registration_code correct doit comporter neuf chiffres ; s’il en a moins, vous devez le compléter avec des zéros en tête.
Pour cela, vous pouvez utiliser la fonction REPLICATE() en combinaison avec LEN() et CONCAT().
Cet exercice fait partie du cours
Nettoyer des données dans des bases SQL Server
Instructions
- Utilisez la fonction appropriée pour concaténer les colonnes
carrier_code, les zéros en tête avant un code d’immatriculation,registration_codeetairport_code. - Répliquez autant de zéros que nécessaire en soustrayant 9 de la longueur de chaque
registration_code. - Filtrez les enregistrements où la colonne
delayedest supérieure à 100.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
SELECT
-- Concat the strings
___(
carrier_code,
' - ',
-- Replicate zeros
___('___', 9 - ___(registration_code)),
registration_code,
', ',
airport_code)
AS registration_code
FROM flight_statistics
-- Filter registers with more than 100 delays
WHERE ___ > 100