1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶNLPの特徴量エンジニアリング

Connected

Exercise

TED Talk の tf-idf ベクトル

この演習では、500 本の TED Talk の書き起こしを含むコーパス ted が用意されています。これらのトークに対して tf-idf ベクトルを作成してください。

後のレッスンでは、これらのベクトルを使って書き起こしに基づく類似トークのレコメンデーションを作成します。

Instrukcje

100 XP
  • sklearn から TfidfVectorizer をインポートします。
  • TfidfVectorizer オブジェクトを作成し、名前を vectorizer にします。
  • fit_transform() メソッドを使って ted の tfidf_matrix を生成します。