Sözcük vektörü benzerliğini ölçme
Bu derste, gerçek dünyada eğitilmiş sözcük vektörlerini kullanarak sözcük vektörlerinin gücünü anlayacağız. Bunlar, Stanford NLP grubu tarafından yayımlanan sözcük vektörleri listesinden alınmış vektörlerdir. Bir sözcük vektörü, sayısal değerlerden oluşan bir dizi ya da vektördür. Örneğin,
dog = (0.31, 0.92, 0.13)
Sözcük vektörleri arasındaki uzaklık, ikili bir benzerlik ölçütüyle ölçülebilir. Burada sklearn.metrics.pairwise.cosine_similarity kullanacağız. Kosinüs benzerliği, iki vektörün eleman bazında benzerliği yüksek olduğunda daha yüksek değerler üretir; tersi durumda ise daha düşük değerler verir.
Bu egzersiz, kursun bir parçasıdır
Keras ile Machine Translation
Egzersiz talimatları
ndarray.sizeözelliğini kullanarakcat_vector'ün uzunluğunu yazdır.cosine_similaritykullanarakcat_vectorilewindow_vectorarasındaki benzerliği hesaplayıp yazdır.cosine_similaritykullanarakcat_vectoriledog_vectorarasındaki benzerliği hesaplayıp yazdır.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
from sklearn.metrics.pairwise import cosine_similarity
# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)
# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)
# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))