Ähnlichkeit von Wortvektoren messen
In dieser Lektion werden wir die Kraft von Wortvektoren anhand von in der Praxis trainierten Wortvektoren verstehen. Das sind Wortvektoren, die aus einer Liste von Wortvektoren extrahiert wurden, die von der Stanford NLP-Gruppe veröffentlicht wurde. Ein Wortvektor ist eine Reihe oder ein Vektor von Zahlenwerten. Ein Beispiel:
dog = (0.31, 0.92, 0.13)
Der Abstand zwischen Wortvektoren kann mit einer paarweisen Ähnlichkeitsmetrik gemessen werden. Hier verwenden wir sklearn.metrics.pairwise.cosine_similarity
. Die Kosinusähnlichkeit ergibt höhere Werte, wenn die elementweise Ähnlichkeit zweier Vektoren hoch ist, und umgekehrt.
Diese Übung ist Teil des Kurses
Maschinelle Übersetzung mit Keras
Anleitung zur Übung
- Druck die Länge von „
cat_vector
” mit dem Attribut „ndarray.size
”. - Berechne und drucke die Ähnlichkeit zwischen
cat_vector
undwindow_vector
mitcosine_similarity
. - Berechne und drucke die Ähnlichkeit zwischen
cat_vector
unddog_vector
mitcosine_similarity
.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
from sklearn.metrics.pairwise import cosine_similarity
# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)
# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)
# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))