Sözcük vektörü benzerliğini ölçme

Bu derste, gerçek dünyada eğitilmiş sözcük vektörlerini kullanarak sözcük vektörlerinin gücünü anlayacağız. Bunlar, Stanford NLP grubu tarafından yayımlanan sözcük vektörleri listesinden alınmış vektörlerdir. Bir sözcük vektörü, sayısal değerlerden oluşan bir dizi ya da vektördür. Örneğin, dog = (0.31, 0.92, 0.13)

Sözcük vektörleri arasındaki uzaklık, ikili bir benzerlik ölçütüyle ölçülebilir. Burada sklearn.metrics.pairwise.cosine_similarity kullanacağız. Kosinüs benzerliği, iki vektörün eleman bazında benzerliği yüksek olduğunda daha yüksek değerler üretir; tersi durumda ise daha düşük değerler verir.

Bu egzersiz, kursun bir parçasıdır

Keras ile Machine Translation

Kursa Göz Atın

Egzersiz talimatları

ndarray.size özelliğini kullanarak cat_vector'ün uzunluğunu yazdır.
cosine_similarity kullanarak cat_vector ile window_vector arasındaki benzerliği hesaplayıp yazdır.
cosine_similarity kullanarak cat_vector ile dog_vector arasındaki benzerliği hesaplayıp yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

from sklearn.metrics.pairwise import cosine_similarity

# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)

# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)

# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))

Kodu Düzenle ve Çalıştır