1. Lära sig
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶ自然言語処理(NLP)

Connected

exercise

製品フィードバックのTF-IDF表現

あなたはスマートホーム企業のカスタマーサポートチームと一緒に働いています。さまざまなスマートデバイスに関するユーザーフィードバックが収集され、各レビューでどの単語が際立っているのかを知りたいと考えています。あなたは、複数のフィードバック間で最も関連性の高い用語を強調表示するために TF-IDF 手法を提案しました。さっそく手伝っていきましょう!

テキストを受け取り、前処理済みテキストを返す preprocess() 関数があらかじめ用意されています。この関数は小文字化、トークン化、句読点の除去を行います。Pandas は pd としてインポート済みで、TfidfVectorizer クラスも使用可能です。

Instruktioner

100 XP
  • TF-IDF の vectorizer を初期化します。
  • クリーニング済みレビューを tfidf_matrix に変換します。
  • 語彙の単語を列にもつ tfidf_matrix の DataFrame df を作成します。