1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

연습 문제

GoT 문자열 토큰화하기

텍스트를 다룰 때 가장 먼저 하는 표준 단계는 토큰화입니다. 즉, 더 큰 문자열을 보통 단어(토큰) 단위의 개별 문자열로 나누는 것입니다.

문자열 GoT가 미리 생성되어 있으며, George R.R. Martin의 Game of Thrones 인용문이 들어 있습니다. 이 문자열을 개별 토큰으로 분리하세요.

지침

100 XP
  • nltk에서 단어 토큰화 함수를 가져오세요.
  • GoT 문자열을 단어 토큰으로 변환하세요.