Overeenkomst tussen woordvectoren meten
In deze les ga je de kracht van woordvectoren ontdekken met echt getrainde woordvectoren. Dit zijn woordvectoren uit een verzameling die is gepubliceerd door de Stanford NLP group. Een woordvector is een reeks, oftewel een vector, van numerieke waarden. Bijvoorbeeld,
dog = (0.31, 0.92, 0.13)
De afstand tussen woordvectoren kun je meten met een paarsgewijze overeenkomstmaat. Hier gebruiken we sklearn.metrics.pairwise.cosine_similarity. Cosinusovereenkomst geeft een hogere waarde wanneer de elementgewijze overeenkomst tussen twee vectoren hoog is, en andersom.
Deze oefening maakt deel uit van de cursus
Machine Translation met Keras
Oefeninstructies
- Print de lengte van de
cat_vectormet het attribuutndarray.size. - Bereken en print de overeenkomst tussen
cat_vectorenwindow_vectormetcosine_similarity. - Bereken en print de overeenkomst tussen
cat_vectorendog_vectormetcosine_similarity.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
from sklearn.metrics.pairwise import cosine_similarity
# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)
# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)
# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))