1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ Machine Learning のための特徴量エンジニアリング

Connected

演習

ハイレベルなテキスト特徴量

テキストをクリーンアップして標準化したら、そこから特徴量を作成できます。自由記述のテキストについて計算できる最も基本的な情報は、その大きさ(文字数や単語数)です。本演習(およびこの章の残り)では、前の演習で作成したクリーン/変換済みテキスト列(text_clean)に注目します。

指示

100 XP
  • 各スピーチの文字数を char_count 列に記録します。
  • 各スピーチの単語数を word_count 列に記録します。
  • 各スピーチの平均単語長を avg_word_length 列に記録します。