Medición de la similitud entre vectores de palabras
En esta lección comprenderemos el poder de los vectores de palabras utilizando vectores de palabras entrenados en el mundo real. Estos son vectores de palabras extraídos de una lista de vectores de palabras publicada por el grupo Stanford NLP. Un vector de palabras es una secuencia o un vector de valores numéricos. Por ejemplo:
dog = (0.31, 0.92, 0.13)
La distancia entre vectores de palabras se puede medir utilizando una métrica de similitud por pares. Aquí utilizaremos sklearn.metrics.pairwise.cosine_similarity
. La similitud coseno produce valores más altos cuando la similitud entre los elementos de dos vectores es alta y viceversa.
Este ejercicio forma parte del curso
Traducción automática con Keras
Instrucciones del ejercicio
- Imprime la longitud de la cadena de caracteres
cat_vector
utilizando el atributondarray.size
. - Calcula e imprime la similitud entre
cat_vector
ywindow_vector
utilizandocosine_similarity
. - Calcula e imprime la similitud entre
cat_vector
ydog_vector
utilizandocosine_similarity
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
from sklearn.metrics.pairwise import cosine_similarity
# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)
# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)
# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))