1. 학습
  2. /
  3. 강의
  4. /
  5. spaCy로 배우는 자연어 처리

Connected

연습 문제

spaCy로 문서 유사도 계산하기

의미적 유사도는 여러 문장을 분석해 서로 얼마나 비슷한지 파악하는 과정이에요. 이번 연습에서는 주어진 문서에 대해 다른 문서들의 의미적 유사도를 계산해 볼 거예요. 목표는 canned dog food와 관련된 리뷰들을 분류하는 것입니다.

canned dog food 카테고리는 category에 저장되어 있어요. 다섯 개의 음식 리뷰 예제가 texts라는 리스트로 제공됩니다. en_core_web_md는 nlp로 로드되어 있어요.

지침

100 XP
  • 모든 texts에 대한 Doc 컨테이너로 이루어진 documents 리스트를 만드세요.
  • category의 Doc 컨테이너를 생성해 category_document로 저장하세요.
  • documents를 순회하면서 각 Doc 컨테이너와 category_document의 유사도 점수를 소수 셋째 자리까지 반올림해 출력하세요.