ComenzarEmpieza gratis

Unificar formatos de vuelos I

Limpiar datos es importante porque, con frecuencia, puedes recibir datos desordenados que no están listos para analizarlos.

En este ejercicio, necesitas obtener todos los registros con más de 100 retrasos de la tabla flight_statistics. En una única columna, debes concatenar carrier_code, registration_code y airport_code, con un formato similar a este: "AA - 000000119, JFK".

Al analizar la tabla flight_statistics, te das cuenta de que algunos valores de registration_code tienen formatos diferentes. Un registration_code correcto debe tener nueve dígitos y, si tiene menos, debes completarlo con ceros a la izquierda.

Para hacerlo, puedes usar la función REPLICATE() en combinación con LEN() y CONCAT().

Este ejercicio forma parte del curso

Limpieza de datos en bases de datos SQL Server

Ver curso

Instrucciones del ejercicio

  • Usa la función adecuada para concatenar las columnas carrier_code, los ceros a la izquierda antes de un código de registro, registration_code y airport_code.
  • Replica tantos ceros como sea necesario restando 9 de la longitud de cada registration_code.
  • Filtra los registros donde la columna delayed sea mayor que 100.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

SELECT 
	-- Concat the strings
	___(
		carrier_code, 
		' - ', 
      	-- Replicate zeros
		___('___', 9 - ___(registration_code)), 
		registration_code, 
		', ', 
		airport_code)
	AS registration_code
FROM flight_statistics
-- Filter registers with more than 100 delays
WHERE ___ > 100
Editar y ejecutar código