1. 학습
  2. /
  3. 강의
  4. /
  5. spaCy로 배우는 자연어 처리

Connected

연습 문제

spaCy 어휘집(vocabulary)

단어 벡터(워드 임베딩)는 단어를 수치로 표현한 것으로, 컴퓨터가 텍스트 데이터를 사용해 복잡한 작업을 수행할 수 있게 해 줍니다. 많은 spaCy 모델에는 단어 벡터가 포함되어 있지만, 일부 모델에는 단어 벡터가 없기도 합니다.

이 연습 문제에서는 spaCy 어휘 정보를 조회하는 방법을 연습해 보겠습니다. 단어 벡터에 대한 일부 메타 정보는 각 spaCy 모델에 저장되어 있어요. 이 정보를 확인하면 어휘집 크기, 단어 벡터 차원 수 등 다양한 내용을 알 수 있습니다.

spaCy 패키지는 이미 임포트되어 있습니다. spaCy 모델의 메타데이터에서, 단어 수는 "vectors" 키의 요소로 저장되고, 단어 벡터의 차원 수는 "width" 키의 요소로 저장됩니다.

지침

100 XP
  • en_core_web_md 모델을 로드하세요.
  • en_core_web_md 모델의 어휘집에 포함된 단어 수를 출력하세요.
  • en_core_web_md 모델의 단어 벡터 차원 수를 출력하세요.