1. 학습
  2. /
  3. 강의
  4. /
  5. spaCy로 배우는 자연어 처리

Connected

연습 문제

spaCy로 어휘 중의성 해소하기

WSD는 문장 속에서 단어가 어떤 의미로 쓰였는지 판별하는 고전적인 문제입니다. 단어의 의미를 정확히 파악하는 것은 검색 엔진, 기계 번역, 질의응답 시스템에서 매우 중요해요. 이 연습 문제에서는 품사 태깅(POS tagging)을 활용해 어휘 중의성을 해소하는 방법을 연습해 보겠습니다.

단어 jam이 들어 있는 두 문장이 있으며, 서로 다른 의미를 가집니다. 주어진 문장에서 단어의 의미를 판별하는 데 도움이 되도록 해당 단어의 품사 태그를 식별해 보세요.

두 문장은 texts 리스트에 들어 있습니다. en_core_web_sm 모델은 이미 로드되어 nlp로 사용할 수 있어요.

지침 1/2

undefined XP
    1
    2
  • texts 리스트의 각 요소에 대한 Doc 컨테이너를 담은 documents 리스트를 만드세요.
  • 각 Doc 컨테이너에서 토큰 텍스트에 jam이 포함된 경우에만, 토큰의 텍스트와 품사 태그의 튜플을 출력하세요.