1. 학습
  2. /
  3. 강의
  4. /
  5. spaCy로 배우는 자연어 처리

Connected

연습 문제

텍스트 범주화를 위한 의미 유사도

의미 유사도의 핵심 목표는 단어, 구, 문장 또는 문서 쌍의 의미적 거리를 측정하는 것입니다. 예를 들어, “car”는 “cat”보다 “bus”와 더 가깝습니다. 이 연습 문제에서는 Amazon Fine Food Reviews의 예시 텍스트에서 단어 sauce와 비슷한 문장을 찾아보겠습니다. 주어진 texts 문자열 안의 문장들에 대해 단어 sauce와의 유사도 점수를 spacy로 계산하고, 가장 유사한 문장의 점수를 보고하세요.

모든 리뷰의 Text 데이터가 포함된 texts 문자열이 미리 로드되어 있습니다. 이 연습에서는 이미 nlp로 제공되는 en_core_web_md 영어 모델을 사용합니다.

지침

100 XP
  • nlp를 사용해 단어 sauce와 texts에 대한 Doc 컨테이너를 생성하고, 각각 key와 sentences에 저장하세요.
  • texts 문자열의 각 문장에 대해 단어 sauce와의 유사도 점수를 계산하세요(소수점 둘째 자리까지 반올림).