1. 학습
  2. /
  3. 강의
  4. /
  5. spaCyで学ぶNatural Language Processing

Connected

연습 문제

語彙内の類似語

意味的に類似した用語を見つけることは、情報検索などで幅広く使われます。この演習では、en_core_web_md モデルの語彙から、単語 computer に最も意味的に近い用語を見つける練習をします。

単語 computer のベクトルはすでに抽出され、word_vector として保存されています。en_core_web_md モデルは nlp として、NumPy は np として読み込まれています。

nlp.vocab.vectors オブジェクトの .most_similar() 関数を使うと、意味的に最も近い用語を見つけられます。この関数の出力に対して [0][0] でインデックス指定すると、類似用語の単語IDが得られます。nlp.vocab.strings[<a given word>] を使うと、ある単語の単語IDを取得でき、同様に特定の単語IDに対応する単語も取得できます。

지침

100 XP
  • en_core_web_md の語彙から、最も意味的に近い用語を見つけてください。
  • 得られた類似用語の単語IDから、類似語のリストを取得してください。