1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w bazach danych SQL Server

Connected

ćwiczenie

Porównywanie nazw za pomocą DIFFERENCE()

W poprzednim ćwiczeniu używałeś(-aś) funkcji SOUNDEX() do sprawdzania imion i nazwisk statystyków z tabeli flight_statistics.

Tym razem chcesz zrobić coś podobnego, ale z użyciem funkcji DIFFERENCE(). Funkcja DIFFERENCE() zwraca wartość 4, gdy dwa ciągi znaków brzmią podobnie lub identycznie, natomiast 0, gdy podobieństwo jest niewielkie lub żadne.

Jeśli wynik DIFFERENCE() dla dwóch ciągów wynosi 4, ale porównywane teksty różnią się od siebie, masz sygnał, które dane wymagają oczyszczenia.

Instrukcje

100 XP
  • Wybierz unikalne wartości kolumn statistician_name i statistician_surname z tabeli S1.
  • Wykonaj złączenie wewnętrzne (INNER JOIN) tabeli flight_statistics jako S2 na podstawie podobnie brzmiących imion i nazwisk – dla rekordów, w których wartość DIFFERENCE między odpowiadającymi kolumnami obu tabel wynosi 4.
  • Odfiltruj rekordy, w których kolumny statistician_name i statistician_surname różnią się od siebie odpowiednio w tabelach S1 i S2.