Overeenkomst tussen woordvectoren meten

In deze les ga je de kracht van woordvectoren ontdekken met echt getrainde woordvectoren. Dit zijn woordvectoren uit een verzameling die is gepubliceerd door de Stanford NLP group. Een woordvector is een reeks, oftewel een vector, van numerieke waarden. Bijvoorbeeld, dog = (0.31, 0.92, 0.13)

De afstand tussen woordvectoren kun je meten met een paarsgewijze overeenkomstmaat. Hier gebruiken we sklearn.metrics.pairwise.cosine_similarity. Cosinusovereenkomst geeft een hogere waarde wanneer de elementgewijze overeenkomst tussen twee vectoren hoog is, en andersom.

Deze oefening maakt deel uit van de cursus

Machine Translation met Keras

Bekijk cursus

Oefeninstructies

Print de lengte van de cat_vector met het attribuut ndarray.size.
Bereken en print de overeenkomst tussen cat_vector en window_vector met cosine_similarity.
Bereken en print de overeenkomst tussen cat_vector en dog_vector met cosine_similarity.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

from sklearn.metrics.pairwise import cosine_similarity

# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)

# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)

# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))

Code bewerken en uitvoeren