1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶMachine Learningの前処理

Connected

演習

テキストのベクトル化

UFO データセットの desc 列を tf/idf ベクトルに変換します。このフィールドから学べる情報がありそうだからです。

指示

100 XP
  • desc 列の .head() を表示します。
  • TfidfVectorizer() オブジェクトを作成します。
  • vec を使って desc 列を学習して変換します。
  • 作成された列数を確認するため、desc_tfidf ベクトルの .shape を表示します。