1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 NLP 피처 엔지니어링

Connected

연습 문제

게티즈버그 연설 토큰화하기

이 연습 문제에서는 미국 남북전쟁 당시 에이브러햄 링컨 대통령이 발표한 역사상 가장 유명한 연설 중 하나인 게티즈버그 연설을 토큰화해 보겠습니다.

연설 전문은 gettysburg라는 문자열로 제공됩니다.

지침

100 XP
  • spacy.load()를 사용해 en_core_web_sm 모델을 로드하세요.
  • 문자열 gettysburg에 대한 Doc 객체 doc을(를) 만드세요.
  • 리스트 컴프리헨션을 사용해 doc을(를) 순회하며 토큰 텍스트를 생성하세요.