1. Lära sig
  2. /
  3. Courses
  4. /
  5. R 중급 정규 표현식

Connected

exercise

두 가지 조건에 기반한 매칭 찾기

이 연습에서는 철자가 틀린 경우도 포함된 두 개의 데이터셋을 영화 제목을 기준으로 매칭해 보겠습니다. 첫 번째 테이블 movie_titles에는 두 번째 테이블 movie_db와 매칭해야 할 영화 10편이 있습니다. 그러나 이들은 스캔된 문서를 바탕으로 하며 광학 문자 인식(OCR) 과정에서 발생한 오류가 포함되어 있습니다.

두 테이블 모두 title과 year 열을 포함합니다. 이 둘을 사용해 서로 매칭을 찾으세요.

유사하거나 동일한 항목을 매칭하기 위한 보조 함수를 2개 만드세요. 하나는 영화 제목용(stringdist() 기반)이고, 다른 하나는 연도를 비교하기 위한 것으로 abs()를 사용해 차이값을 계산합니다.

Instruktioner 1 / 3

undefined XP
  • 1
    • left와 right 사이의 stringdistance가 3 미만이면 TRUE를 반환하도록 함수 is_string_distance_below_three()를 작성하세요.
  • 2
    • left와 right의 절대 차이가 3보다 작으면 TRUE를 반환하도록 is_closer_than_three_years()를 작성하세요.
  • 3
    • 보조 함수를 사용해 두 데이터 프레임을 "title"과 "year" 두 열을 기준으로 조인하세요.