1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 Sentiment Analysis

Connected

연습 문제

토큰 패턴 지정하기

이번 연습에서는 tweets 데이터셋의 text 열을 사용해 봅니다. 과제는 CountVectorizer를 사용하여 이 객체 열을 벡터화하는 것입니다. 벡터라이저에서 서로 다른 토큰 패턴을 적용해 보세요. 토큰 패턴을 지정하면 특정 문자를 걸러낼 수 있다는 점을 기억하세요.

CountVectorizer는 이미 임포트되어 있습니다.

지침 1/2

undefined XP
    1
    2
  • text 열에서 벡터라이저를 만들고, 토큰 패턴을 r'\b[^\d\W][^\d\W]'와 같도록 지정하세요.