Medición de la similitud entre vectores de palabras

En esta lección comprenderemos el poder de los vectores de palabras utilizando vectores de palabras entrenados en el mundo real. Estos son vectores de palabras extraídos de una lista de vectores de palabras publicada por el grupo Stanford NLP. Un vector de palabras es una secuencia o un vector de valores numéricos. Por ejemplo: dog = (0.31, 0.92, 0.13)

La distancia entre vectores de palabras se puede medir utilizando una métrica de similitud por pares. Aquí utilizaremos sklearn.metrics.pairwise.cosine_similarity. La similitud coseno produce valores más altos cuando la similitud entre los elementos de dos vectores es alta y viceversa.

Este ejercicio forma parte del curso

Traducción automática con Keras

Ver curso

Instrucciones del ejercicio

Imprime la longitud de la cadena de caracteres cat_vector utilizando el atributo ndarray.size.
Calcula e imprime la similitud entre cat_vector y window_vector utilizando cosine_similarity.
Calcula e imprime la similitud entre cat_vector y dog_vector utilizando cosine_similarity.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

from sklearn.metrics.pairwise import cosine_similarity

# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)

# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)

# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))

Editar y ejecutar código