1. Lära sig
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶNLPの特徴量エンジニアリング

Connected

exercise

特徴インデックスを特徴名にマッピングする

レッスン動画で、CountVectorizer は語彙を必ずしもアルファベット順にインデックスしないことを確認しました。この演習では、各特徴インデックスを語彙中の対応する特徴名にマッピングする方法を学びます。

動画と同じ、ライオンに関する3つの文を使います。これらの文は corpus というリストに入っており、すでにコンソールに出力されています。

Instruktioner

100 XP
  • CountVectorizer オブジェクトを作成し、vectorizer という名前を付けてください。
  • fit_transform() を使って、corpus から bow_matrix を生成してください。
  • get_feature_names() メソッドを使って、列名を語彙中の対応する単語にマッピングしてください。