1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w Pythonie

Connected

ćwiczenie

Podobne restauracje

W poprzednim ćwiczeniu wygenerowałeś pary między restaurants a restaurants_new, aby móc czysto połączyć oba zbiory danych za pomocą łączenia rekordów.

Podczas łączenia rekordów możesz stosować różne typy dopasowań między kolumnami zbiorów danych – w tym dokładne dopasowania, podobieństwo ciągów znaków i inne.

Teraz, gdy pary zostały wygenerowane i zapisane w pairs, znajdziesz dokładne dopasowania w kolumnach city i cuisine_type dla każdej pary oraz podobne ciągi znaków w kolumnie rest_name. W środowisku dostępne są oba zbiory danych, pandas oraz recordlinkage.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Utwórz obiekt porównania za pomocą funkcji recordlinkage.Compare().