1. 学习
  2. /
  3. 课程
  4. /
  5. Python으로 데이터 정제하기

Connected

练习

유사한 레스토랑 찾기

이전 연습 문제에서 레코드 연결(record linkage)을 사용해 두 DataFrame을 깔끔하게 병합하기 위해 restaurants와 restaurants_new 사이의 페어를 생성했어요.

레코드 연결을 수행할 때는 DataFrame의 서로 다른 열 사이에서 정확 일치, 문자열 유사도 등 다양한 방식으로 매칭할 수 있어요.

이제 pairs에 페어가 생성되어 저장되어 있으니, 각 페어의 city와 cuisine_type 열에서 정확히 일치하는 값을 찾고, rest_name 열에서는 유사한 문자열을 찾아볼 거예요. 두 DataFrame과 pandas, recordlinkage는 환경에 로드되어 있어요.

说明 1 / 共 4 个

undefined XP
    1
    2
    3
    4
  • recordlinkage.Compare() 함수를 사용해 비교(comparison) 객체를 인스턴스화하세요.