Aan de slagGa gratis aan de slag

Formaten van vluchten uniformeren I

Data opschonen is belangrijk, omdat je vaak rommelige data krijgt die nog niet klaar is voor analyse.

In deze oefening haal je alle registraties met meer dan 100 vertragingen op uit de tabel flight_statistics. In een unieke kolom moet je carrier_code, registration_code en airport_code samenvoegen in een formaat zoals: "AA - 000000119, JFK".

Bij het analyseren van de tabel flight_statistics merk je dat sommige waarden in registration_code verschillende formaten hebben. Een correcte registration_code moet uit negen cijfers bestaan; als er minder zijn, vul je aan met voorloopnullen.

Hiervoor kun je de functie REPLICATE() gebruiken in combinatie met LEN() en CONCAT().

Deze oefening maakt deel uit van de cursus

Gegevens opschonen in SQL Server-databases

Cursus bekijken

Oefeninstructies

  • Gebruik de juiste functie om de kolommen carrier_code, de voorloopnullen vóór een registratienummer, registration_code en airport_code te concateneren.
  • Herhaal zoveel nullen als nodig door 9 af te trekken van de lengte van elke registration_code.
  • Filter de registraties waarbij de kolom delayed groter is dan 100.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

SELECT 
	-- Concat the strings
	___(
		carrier_code, 
		' - ', 
      	-- Replicate zeros
		___('___', 9 - ___(registration_code)), 
		registration_code, 
		', ', 
		airport_code)
	AS registration_code
FROM flight_statistics
-- Filter registers with more than 100 delays
WHERE ___ > 100
Code bewerken en uitvoeren