BaşlayınÜcretsiz Başlayın

Sözcük vektörü benzerliğini ölçme

Bu derste, gerçek dünyada eğitilmiş sözcük vektörlerini kullanarak sözcük vektörlerinin gücünü anlayacağız. Bunlar, Stanford NLP grubu tarafından yayımlanan sözcük vektörleri listesinden alınmış vektörlerdir. Bir sözcük vektörü, sayısal değerlerden oluşan bir dizi ya da vektördür. Örneğin, dog = (0.31, 0.92, 0.13)

Sözcük vektörleri arasındaki uzaklık, ikili bir benzerlik ölçütüyle ölçülebilir. Burada sklearn.metrics.pairwise.cosine_similarity kullanacağız. Kosinüs benzerliği, iki vektörün eleman bazında benzerliği yüksek olduğunda daha yüksek değerler üretir; tersi durumda ise daha düşük değerler verir.

Bu egzersiz

Keras ile Machine Translation

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • ndarray.size özelliğini kullanarak cat_vector'ün uzunluğunu yazdır.
  • cosine_similarity kullanarak cat_vector ile window_vector arasındaki benzerliği hesaplayıp yazdır.
  • cosine_similarity kullanarak cat_vector ile dog_vector arasındaki benzerliği hesaplayıp yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

from sklearn.metrics.pairwise import cosine_similarity

# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)

# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)

# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))
Kodu Düzenle ve Çalıştır