1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ Natural Language Processing 入門

Connected

演習

tf-idf とは何ですか?

単語 "computer" の tf-idf 重みを計算したいとします。この単語は、100 語からなるある文書中に 5 回出現します。コーパス全体は 200 文書からなり、そのうち 20 文書に "computer" が出現します。tf-idf は、単語の出現頻度(term frequency)に逆文書頻度(inverse document frequency)を掛けて計算します。

Term frequency = 文書内の全トークン数に対するその単語の割合 Inverse document frequency = コーパス内の総文書数をその単語を含む文書数で割った値の対数

次のどの選択肢が正しいですか?

指示

50 XP

選択肢