Uniformiser les formats de vols I
Le nettoyage des données est essentiel, car il arrive souvent de récupérer des données désordonnées qui ne sont pas prêtes à être analysées.
Dans cet exercice, vous devez récupérer tous les enregistrements avec plus de 100 retards depuis la table flight_statistics. Dans une colonne unique, vous devez concaténer carrier_code, registration_code et airport_code, avec un format similaire à celui-ci : "AA - 000000119, JFK".
En analysant la table flight_statistics, vous constatez que certaines valeurs de registration_code ont des formats différents. Un registration_code correct doit comporter neuf chiffres ; s’il en a moins, vous devez le compléter avec des zéros en tête.
Pour cela, vous pouvez utiliser la fonction REPLICATE() en combinaison avec LEN() et CONCAT().
Cet exercice fait partie du cours
<cours>Nettoyer des données dans des bases SQL Server</cours>Instructions de l’exercice
- Utilisez la fonction appropriée pour concaténer les colonnes
carrier_code, les zéros en tête avant un code d’immatriculation,registration_codeetairport_code. - Répliquez autant de zéros que nécessaire en soustrayant 9 de la longueur de chaque
registration_code. - Filtrez les enregistrements où la colonne
delayedest supérieure à 100.
Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
SELECT
-- Concat the strings
___(
carrier_code,
' - ',
-- Replicate zeros
___('___', 9 - ___(registration_code)),
registration_code,
', ',
airport_code)
AS registration_code
FROM flight_statistics
-- Filter registers with more than 100 delays
WHERE ___ > 100