Unificando formatos de voos I
Limpar dados é importante porque, com frequência, você pode receber dados bagunçados que não estão prontos para análise.
Neste exercício, você precisa obter todos os registros com mais de 100 atrasos da tabela flight_statistics. Em uma única coluna, você deve concatenar carrier_code, registration_code e airport_code, seguindo um formato semelhante a este: "AA - 000000119, JFK".
Ao analisar a tabela flight_statistics, você percebe que alguns valores de registration_code têm formatos diferentes. Um registration_code correto deve ter nove dígitos e, se tiver menos, você precisa completá-lo com zeros à esquerda.
Para fazer isso, você pode usar a função REPLICATE() em combinação com LEN() e CONCAT().
Este exercício faz parte do curso
Limpando dados em bancos de dados SQL Server
Instruções do exercício
- Use a função apropriada para concatenar as colunas
carrier_code, os zeros à esquerda antes de um código de registro,registration_codeeairport_code. - Replique quantos zeros forem necessários subtraindo 9 do comprimento de cada
registration_code. - Filtre os registros em que a coluna
delayedé maior que 100.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
SELECT
-- Concat the strings
___(
carrier_code,
' - ',
-- Replicate zeros
___('___', 9 - ___(registration_code)),
registration_code,
', ',
airport_code)
AS registration_code
FROM flight_statistics
-- Filter registers with more than 100 delays
WHERE ___ > 100