Uniformare i formati dei voli I
Pulire i dati è importante perché spesso potresti ricevere dati disordinati, non ancora pronti per l'analisi.
In questo esercizio, devi recuperare tutti i record con più di 100 ritardi dalla tabella flight_statistics. In un'unica colonna, devi concatenare carrier_code, registration_code e airport_code, ottenendo un formato simile a questo: "AA - 000000119, JFK".
Analizzando la tabella flight_statistics, ti accorgi che alcuni valori di registration_code hanno formati diversi. Un registration_code corretto deve avere nove cifre; se ne ha di meno, devi completarlo con zeri iniziali.
Per farlo, puoi usare la funzione REPLICATE() in combinazione con LEN() e CONCAT().
Questo esercizio fa parte del corso
Pulizia dei dati nei database SQL Server
Istruzioni dell'esercizio
- Usa la funzione appropriata per concatenare le colonne
carrier_code, gli zeri iniziali prima di un codice di registrazione,registration_codeeairport_code. - Replica il numero di zeri necessario sottraendo 9 dalla lunghezza di ciascun
registration_code. - Filtra i record in cui la colonna
delayedè maggiore di 100.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
SELECT
-- Concat the strings
___(
carrier_code,
' - ',
-- Replicate zeros
___('___', 9 - ___(registration_code)),
registration_code,
', ',
airport_code)
AS registration_code
FROM flight_statistics
-- Filter registers with more than 100 delays
WHERE ___ > 100