1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

演習

はじめての TfIdf

この演習では、レフ・トルストイの『アンナ・カレーニナ』の最初の一文を含む小さな annak データセットに、TfIdf 手法を適用します。

このデータセットを使って TfidfVectorizer() 関数を適用してください。テキストを数値に変換することは、テキストの感情を理解するための第一歩であることを思い出してください。Tfidf ベクトライザは、感情の列から語彙を構築するもう一つの方法です。

指示

100 XP
  • sklearn.feature_extraction.text から TfIdf ベクトライザを作成する関数をインポートします。
  • TfidfVectorizer() 関数を呼び出し、annak データセットで fit します。
  • そのベクトライザを変換します。