Sözcük vektörü benzerliğini ölçme
Bu derste, gerçek dünyada eğitilmiş sözcük vektörlerini kullanarak sözcük vektörlerinin gücünü anlayacağız. Bunlar, Stanford NLP grubu tarafından yayımlanan sözcük vektörleri listesinden alınmış vektörlerdir. Bir sözcük vektörü, sayısal değerlerden oluşan bir dizi ya da vektördür. Örneğin,
dog = (0.31, 0.92, 0.13)
Sözcük vektörleri arasındaki uzaklık, ikili bir benzerlik ölçütüyle ölçülebilir. Burada sklearn.metrics.pairwise.cosine_similarity kullanacağız. Kosinüs benzerliği, iki vektörün eleman bazında benzerliği yüksek olduğunda daha yüksek değerler üretir; tersi durumda ise daha düşük değerler verir.
Bu egzersiz
Keras ile Machine Translation
kursunun bir parçasıdırEgzersiz talimatları
ndarray.sizeözelliğini kullanarakcat_vector'ün uzunluğunu yazdır.cosine_similaritykullanarakcat_vectorilewindow_vectorarasındaki benzerliği hesaplayıp yazdır.cosine_similaritykullanarakcat_vectoriledog_vectorarasındaki benzerliği hesaplayıp yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
from sklearn.metrics.pairwise import cosine_similarity
# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)
# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)
# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))