1. Învăţa
  2. /
  3. Courses
  4. /
  5. Python で学ぶ Natural Language Processing 入門

Connected

exercise

Wikipedia での Tf-idf

ここからは、gensim の tf-idf を適用して、コーパスにおける新しい重要語を見つけていきます。前の演習で作成した dictionary、corpus、doc は引き続き使えます。tf-idf を使うと、文書レベルでより興味深い結果になるでしょうか。

TfidfModel は gensim.models.tfidfmodel からインポート済みです。

Instrucțiuni 1 / 2

undefined XP
    1
    2
  • corpus を使って、新しい TfidfModel を tfidf という名前で初期化します。
  • doc を使って重みを計算します。tfidf に [doc] を渡せば実行できます。
  • 重み付きの単語 ID を先頭から5件表示します。