Medindo a semelhança entre vetores de palavras
Nesta aula, vamos entender o poder dos vetores de palavras usando vetores de palavras treinados no mundo real. Esses são vetores de palavras que a gente pegou de uma lista de vetores de palavras que o grupo de NLP da Stanford publicou. Um vetor de palavras é uma sequência ou um vetor de valores numéricos. Por exemplo:
dog = (0.31, 0.92, 0.13)
A distância entre vetores de palavras pode ser medida usando uma métrica de similaridade em pares. Aqui, vamos usar sklearn.metrics.pairwise.cosine_similarity
. A similaridade coseno dá valores mais altos quando a similaridade entre os elementos de dois vetores é alta e vice-versa.
Este exercício faz parte do curso
Tradução automática com Keras
Instruções do exercício
- Imprima o comprimento do objeto
cat_vector
usando o atributondarray.size
. - Calcule e imprima a semelhança entre
cat_vector
ewindow_vector
usandocosine_similarity
. - Calcule e imprima a semelhança entre
cat_vector
edog_vector
usandocosine_similarity
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
from sklearn.metrics.pairwise import cosine_similarity
# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)
# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)
# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))