1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w bazach PostgreSQL

Connected

ćwiczenie

Dopasowywanie niespójnych nazw kolorów

Na podstawie przykładowych rekordów z tabeli parking_violation widać wyraźnie, że wartości w kolumnie vehicle_color są niespójne. Na przykład 'GRY', 'GRAY' i 'GREY' – wszystkie opisują szary pojazd. Aby ujednolicić ten kolor, warto stosować jedną, spójną wartość. Z pomocą przychodzi tutaj funkcja DIFFERENCE().

W tym ćwiczeniu użyjesz funkcji DIFFERENCE(), aby znaleźć rekordy zawierające wartość vehicle_color zbliżoną brzmieniowo do ciągu 'GRAY'. Moduł fuzzystrmatch jest już dla ciebie włączony.

Instrukcje

100 XP
  • Użyj funkcji DIFFERENCE(), aby znaleźć rekordy w tabeli parking_violation, w których kod Soundex kolumny vehicle_color pasuje do kodu Soundex ciągu 'GRAY'. Pamiętaj, że funkcja DIFFERENCE() przyjmuje wartości tekstowe (nie kody Soundex) jako argumenty.