1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ Machine Learning のための特徴量エンジニアリング

Connected

演習

Tf-idf の値を確認する

Tf-idf 特徴量を作成したら、各コーパスでスコアが最も高い単語を把握したくなることがよくあります。これは、調べたい行を取り出し、スコアを高い順に並べ替えることで実現できます。

前の演習で作成した DataFrame(tv_df)はワークスペースに用意されています。

指示

100 XP
  • tv_df の最初の行を sample_row に代入します。
  • sample_row は単語に割り当てられた重みの Series です。これらの値を並べ替えて、スコア上位5語を表示してください。