ComeçarComece de graça

Unificando formatos de voos I

Limpar dados é importante porque, com frequência, você pode receber dados bagunçados que não estão prontos para análise.

Neste exercício, você precisa obter todos os registros com mais de 100 atrasos da tabela flight_statistics. Em uma única coluna, você deve concatenar carrier_code, registration_code e airport_code, seguindo um formato semelhante a este: "AA - 000000119, JFK".

Ao analisar a tabela flight_statistics, você percebe que alguns valores de registration_code têm formatos diferentes. Um registration_code correto deve ter nove dígitos e, se tiver menos, você precisa completá-lo com zeros à esquerda.

Para fazer isso, você pode usar a função REPLICATE() em combinação com LEN() e CONCAT().

Este exercício faz parte do curso

Limpando dados em bancos de dados SQL Server

Ver curso

Instruções do exercício

  • Use a função apropriada para concatenar as colunas carrier_code, os zeros à esquerda antes de um código de registro, registration_code e airport_code.
  • Replique quantos zeros forem necessários subtraindo 9 do comprimento de cada registration_code.
  • Filtre os registros em que a coluna delayed é maior que 100.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

SELECT 
	-- Concat the strings
	___(
		carrier_code, 
		' - ', 
      	-- Replicate zeros
		___('___', 9 - ___(registration_code)), 
		registration_code, 
		', ', 
		airport_code)
	AS registration_code
FROM flight_statistics
-- Filter registers with more than 100 delays
WHERE ___ > 100
Editar e executar o código