1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w R

Connected

ćwiczenie

Blokowanie par

Zagat i Fodor's to firmy zbierające recenzje restauracji. Zbiory danych zagat i fodors zawierają informacje o różnych restauracjach – w tym adresy, numery telefonów i rodzaje kuchni. Niektóre restauracje pojawiają się w obu zbiorach, ale ich nazwy lub numery telefonów mogą się od siebie różnić. W tym rozdziale sprawdzisz, które restauracje występują w obu zbiorach danych.

Pierwszym krokiem jest wygenerowanie par rekordów, które następnie można ze sobą porównać. W tym ćwiczeniu najpierw wygenerujesz wszystkie możliwe pary, a potem użyjesz oczyszczonej kolumny city jako zmiennej blokującej.

Zbiory danych zagat i fodors są dostępne.

Instrukcje 1/2

undefined XP
  • 1
    • Wczytaj pakiet reclin.
    • Wygeneruj wszystkie możliwe pary rekordów ze zbiorów danych zagat i fodors.
  • 2
    • Użyj blokowania par, aby wygenerować tylko te pary, które mają zgodne wartości w kolumnie city.