1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 챗봇 만들기

Connected

Exercise

spaCy로 단어 벡터 다루기

이 연습 문제에서는 단어 벡터를 처음으로 다뤄 보겠습니다! 현실의 사용자가 항공권 예약 시스템과 상호작용하며 발화한 문장들로 구성된 ATIS 데이터셋을 사용할 거예요.

사용자 발화는 리스트 sentences에, 이에 대응하는 intent는 labels에 들어 있습니다.

여러분의 목표는 데이터셋의 문장 수만큼 행을 갖는 2차원 배열 X를 만들고, 각 행에 해당 문장을 표현하는 벡터를 담는 것입니다.

Instructions

100 XP
  • 'en'을 인자로 spacy.load()를 호출해 spaCy 영어 모델을 로드하세요.
  • len()으로 sentences의 길이를 구하고, nlp.vocab.vectors_length로 단어 벡터의 차원을 구하세요.
  • 각 문장에 대해, sentence 하나만 인자로 nlp 객체를 호출하세요. 결과를 doc으로 저장합니다.
  • doc의 .vector 속성을 사용해 각 문장의 벡터 표현을 얻고, 이 벡터를 X의 해당 행에 저장하세요.