1. Learn
  2. /
  3. Courses
  4. /
  5. spaCyで学ぶNatural Language Processing

Connected

Exercise

spaCy での Doc 類似度

意味的類似度とは、複数の文を解析して互いの類似性を見つけることです。この演習では、与えられたドキュメントに対する文書の意味的類似度を計算する練習をします。目的は、canned dog food(犬用缶詰)に関連するレビューを分類することです。

canned dog food のカテゴリは category に保存されています。5件のフードレビューのサンプルは、texts というリストで提供されています。en_core_web_md は nlp として読み込まれています。

Instructions

100 XP
  • すべての texts から Doc コンテナを作成し、documents リストに格納します。
  • category の Doc コンテナを作成し、category_document として保存します。
  • documents を反復し、各 Doc コンテナと category_document の類似度スコアを、小数点以下3桁に丸めて出力します。