spaCy 어휘의 단어 벡터

단어 벡터의 목적은 컴퓨터가 단어를 이해할 수 있도록 하는 데 있어요. 이번 연습에서는 주어진 단어 목록에 대해 단어 벡터를 추출하는 방법을 연습해 봅니다.

단어 목록은 words로 준비되어 있어요. en_core_web_md 모델은 이미 불러와져 있으며 nlp로 사용할 수 있어요.

en_core_web_md 모델의 어휘에는 20,000개의 단어가 들어 있어요. 어휘에 없는 단어는 해당 단어 벡터를 추출할 수 없어요. 이 연습에서는 단순화를 위해 제공된 모든 단어가 이 모델의 어휘에 존재하도록 했습니다.