1. 학습
  2. /
  3. 강의
  4. /
  5. spaCy로 배우는 자연어 처리

Connected

연습 문제

spaCy 어휘의 단어 벡터

단어 벡터의 목적은 컴퓨터가 단어를 이해할 수 있도록 하는 데 있어요. 이번 연습에서는 주어진 단어 목록에 대해 단어 벡터를 추출하는 방법을 연습해 봅니다.

단어 목록은 words로 준비되어 있어요. en_core_web_md 모델은 이미 불러와져 있으며 nlp로 사용할 수 있어요.

en_core_web_md 모델의 어휘에는 20,000개의 단어가 들어 있어요. 어휘에 없는 단어는 해당 단어 벡터를 추출할 수 없어요. 이 연습에서는 단순화를 위해 제공된 모든 단어가 이 모델의 어휘에 존재하도록 했습니다.

지침

100 XP
  • 주어진 words의 모든 ID를 추출해 ids 리스트에 저장하세요.
  • ids의 각 ID에 대해, 해당 단어 벡터의 처음 10개 원소를 word_vectors 리스트에 저장하세요.
  • word_vectors에서 첫 번째 단어 벡터의 처음 10개 원소를 출력하세요.