1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Cleaning Data in SQL Server Databases

Connected

cvičení

Sjednocení formátů letů I

Čištění dat je důležité, protože v praxi se často setkáš s daty, která nejsou připravená k analýze.

V tomto cvičení potřebuješ z tabulky flight_statistics získat všechny záznamy s více než 100 zpožděními. Do jednoho sloupce pak zřetěz hodnoty carrier_code, registration_code a airport_code tak, aby výsledek vypadal takto: "AA - 000000119, JFK".

Při analýze tabulky flight_statistics si všimneš, že některé hodnoty registration_code mají různé formáty. Správný registration_code musí mít devět číslic – pokud jich má méně, je potřeba ho doplnit úvodními nulami.

K tomu využij funkci REPLICATE() v kombinaci s funkcemi LEN() a CONCAT().

Pokyny

100 XP
  • Použij příslušnou funkci pro zřetězení sloupců carrier_code, úvodních nul před registračním kódem, registration_code a airport_code.
  • Počet nul k doplnění urči tak, že od čísla 9 odečteš délku každého registration_code.
  • Vyfiltruj záznamy, kde je hodnota sloupce delayed větší než 100.