1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ Machine Learning のための特徴量エンジニアリング

Connected

演習

最もよく出現する単語を見つける

特徴量を作成したら、期待どおりになっているかを確認するために中身を点検するのが常におすすめです。これにより、早い段階でエラーに気づけますし、その後に必要な追加の特徴量エンジニアリングを見直すきっかけにもなります。

前の演習で学習したベクトライザ(cv)と、単語出現回数からなるスパース配列(cv_trigram)はワークスペースに用意されています。

指示

100 XP
  • 特徴量(単語出現回数)の DataFrame を作成します。
  • 単語の出現回数を集計し、最も頻出する単語の上位5件を表示します。