1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w bazach danych SQL Server

Connected

ćwiczenie

Ujednolicanie formatów lotów I

Czyszczenie danych jest ważne, ponieważ w praktyce często trafiasz na nieuporządkowane dane, które nie są gotowe do analizy.

W tym ćwiczeniu pobierz z tabeli flight_statistics wszystkie rekordy, w których liczba opóźnień przekracza 100. W jednej kolumnie połącz wartości carrier_code, registration_code i airport_code w formacie podobnym do tego: "AA - 000000119, JFK".

Po przeanalizowaniu tabeli flight_statistics zauważysz, że niektóre wartości registration_code mają różne formaty. Prawidłowy registration_code musi składać się z dziewięciu cyfr – jeśli ma ich mniej, uzupełnij go wiodącymi zerami.

Możesz to zrobić, używając funkcji REPLICATE() w połączeniu z funkcjami LEN() i CONCAT().

Instrukcje

100 XP
  • Użyj odpowiedniej funkcji, aby połączyć kolumny carrier_code, wiodące zera przed kodem rejestracyjnym, registration_code oraz airport_code.
  • Powiel odpowiednią liczbę zer, odejmując od 9 długość każdej wartości registration_code.
  • Odfiltruj rekordy, w których wartość kolumny delayed jest większa niż 100.