1. 学ぶ
  2. /
  3. コース
  4. /
  5. Kerasで学ぶMachine Translation

Connected

演習

単語ベクトルの類似度を測る

このレッスンでは、実際に学習済みの単語ベクトルを使って、その威力を体感します。ここで使うのは、Stanford NLP group が公開している単語ベクトルの一覧から抽出したものです。単語ベクトルとは、数値の並び(ベクトル)です。たとえば、 dog = (0.31, 0.92, 0.13)

単語ベクトル間の距離は、ペアごとの類似度指標で測定できます。ここでは sklearn.metrics.pairwise.cosine_similarity を使用します。コサイン類似度は、2つのベクトルの要素ごとのパターンが似ているほど高い値を返し、似ていないほど低い値になります。

指示

100 XP
  • ndarray.size 属性を使って、cat_vector の長さを出力してください。
  • cosine_similarity を使って、cat_vector と window_vector の類似度を計算して出力してください。
  • cosine_similarity を使って、cat_vector と dog_vector の類似度を計算して出力してください。