1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

演習

トークンパターンを指定する

この演習では、tweets データセットの text 列を扱います。課題は、CountVectorizer を使ってこのオブジェクト列をベクトル化することです。ベクトライザで異なるトークンパターンを適用します。トークンパターンを指定することで、特定の文字を除外できる点を思い出してください。

CountVectorizer はインポート済みです。

指示1 / 2

undefined XP
    1
    2
  • text 列からベクトライザを作成し、トークンパターンを r'\b[^\d\W][^\d\W]' に指定してください。