1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

演習

GoT の文字列をトークン化する

テキストを扱うときの最初の基本ステップはトークン化です。つまり、長い文字列を、通常は単語(トークン)ごとの小さな文字列に分割します。

文字列 GoT はすでに用意されており、George R.R. Martin の『Game of Thrones』からの引用が入っています。これを個々のトークンに分割してください。

指示

100 XP
  • nltk から単語のトークン化関数をインポートします。
  • GoT 文字列を単語トークンに変換します。