1. 학습
  2. /
  3. 강의
  4. /
  5. R로 데이터 정리하기

Connected

연습 문제

문자열 거리로 오타 바로잡기

이번 챕터에서 다루실 데이터셋 중 하나인 zagat에는 New York, Los Angeles, Atlanta, San Francisco, Las Vegas의 레스토랑 정보가 들어 있습니다. 이 데이터는 레스토랑 리뷰를 수집하는 회사인 Zagat에서 제공한 것으로, 레스토랑 이름, 주소, 전화번호와 기타 정보가 포함되어 있어요.

city 열에는 각 레스토랑이 위치한 도시 이름이 들어 있지만, 곳곳에 오타가 있습니다. 여러분의 작업은 각 city 값을 cities 데이터 프레임에 들어 있는 다섯 개의 올바른 도시명 중 하나에 매핑하는 것입니다.

dplyr과 fuzzyjoin은 로드되어 있고, zagat과 cities는 사용할 수 있습니다.

지침 1/2

undefined XP
    1
    2
  • zagat에서 city 이름의 각 변형이 몇 번씩 등장하는지 개수를 세세요.