Ähnlichkeit von Wortvektoren messen

In dieser Lektion werden wir die Kraft von Wortvektoren anhand von in der Praxis trainierten Wortvektoren verstehen. Das sind Wortvektoren, die aus einer Liste von Wortvektoren extrahiert wurden, die von der Stanford NLP-Gruppe veröffentlicht wurde. Ein Wortvektor ist eine Reihe oder ein Vektor von Zahlenwerten. Ein Beispiel: dog = (0.31, 0.92, 0.13)

Der Abstand zwischen Wortvektoren kann mit einer paarweisen Ähnlichkeitsmetrik gemessen werden. Hier verwenden wir sklearn.metrics.pairwise.cosine_similarity. Die Kosinusähnlichkeit ergibt höhere Werte, wenn die elementweise Ähnlichkeit zweier Vektoren hoch ist, und umgekehrt.

Diese Übung ist Teil des Kurses

<Kurs>Maschinelle Übersetzung mit Keras</Kurs>

Kurs ansehen

Übungsanweisungen

Druck die Länge von „ cat_vector ” mit dem Attribut „ ndarray.size ”.
Berechne und drucke die Ähnlichkeit zwischen cat_vector und window_vector mit cosine_similarity.
Berechne und drucke die Ähnlichkeit zwischen cat_vector und dog_vector mit cosine_similarity.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

from sklearn.metrics.pairwise import cosine_similarity

# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)

# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)

# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))

Code bearbeiten und ausführen