1. 학습
  2. /
  3. 강의
  4. /
  5. R로 데이터 정리하기

Connected

연습 문제

페어 블로킹

Zagat와 Fodor's는 모두 레스토랑 리뷰를 수집하는 회사예요. zagat과 fodors 데이터셋에는 주소, 전화번호, 음식 종류 등 다양한 레스토랑 정보가 담겨 있어요. 두 데이터셋에 모두 등장하는 레스토랑도 있지만, 이름이나 전화번호가 정확히 동일하게 기록되어 있지는 않을 수 있어요. 이번 장에서는 두 데이터셋에 모두 존재하는 레스토랑이 무엇인지 파악해 볼 거예요.

이를 위해 먼저 각 레코드 간 비교가 가능하도록 페어(쌍)를 생성해야 해요. 이 연습 문제에서는 먼저 가능한 모든 페어를 만들고, 이후 새로 정리한 city 열을 블로킹 변수로 사용해 보겠습니다.

zagat과 fodors는 제공되어 있어요.

지침 1/2

undefined XP
  • 1
    • reclin 패키지를 불러오세요.
    • zagat과 fodors 데이터셋 사이의 가능한 모든 레코드 페어를 생성하세요.
  • 2
    • 페어 블로킹을 사용해 city 열의 값이 일치하는 페어만 생성하세요.