単語ベクトルの類似度を測る

このレッスンでは、実際に学習済みの単語ベクトルを使って、その威力を体感します。ここで使うのは、Stanford NLP group が公開している単語ベクトルの一覧から抽出したものです。単語ベクトルとは、数値の並び（ベクトル）です。たとえば、 dog = (0.31, 0.92, 0.13)

単語ベクトル間の距離は、ペアごとの類似度指標で測定できます。ここでは sklearn.metrics.pairwise.cosine_similarity を使用します。コサイン類似度は、2つのベクトルの要素ごとのパターンが似ているほど高い値を返し、似ていないほど低い値になります。