1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w R

Connected

ćwiczenie

Łącząc wszystko w całość

W tym rozdziale wyczyściliśmy kolumnę city w zbiorze zagat przy użyciu podobieństwa ciągów znaków, a także wygenerowaliśmy i porównaliśmy pary restauracji ze zbiorów zagat i fodors. Koniec jest bliski – pozostało już tylko ocenić i wybrać pary, a następnie połączyć dane. Analiza jest na wyciągnięcie ręki!

Biblioteki reclin i dplyr są wczytane, a zbiory zagat i fodors są dostępne.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Oceń pary rekordów metodą probabilistyczną.