1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶ自然言語処理(NLP)

Connected

演習

BoW と TF-IDF 表現を比較する

あなたはウェアラブル端末企業のアナリティクスチームの一員です。目的は、新しいスマートウォッチに関する顧客フィードバックをプロダクトマネージャーが理解できるよう支援することです。テキストの前処理はすでに完了しており、CountVectorizer() で作成した bow_matrix と、TfidfVectorizer() で作成した tfidf_matrix の2種類の表現があります。本演習では、これらを可視化して比較し、それぞれが単語の重要度をどのように捉えるかを理解します。

指示1 / 2

undefined XP
  • 1
    • 提供された bow_matrix を使って DataFrame を作成し、各レビューの単語頻度をヒートマップで可視化します。
  • 2
    • tfidf_matrix から DataFrame を作成し、TF-IDF スコアをヒートマップで可視化します。