Medindo a similaridade entre vetores de palavras
Nesta lição, você vai entender o poder dos vetores de palavras usando vetores treinados no mundo real. Estes são vetores extraídos de uma lista publicada pelo grupo Stanford NLP. Um vetor de palavra é uma sequência (ou vetor) de valores numéricos. Por exemplo,
dog = (0.31, 0.92, 0.13)
A distância entre vetores de palavras pode ser medida usando uma métrica de similaridade par a par. Aqui, vamos usar sklearn.metrics.pairwise.cosine_similarity. A similaridade do cosseno gera valores mais altos quando a similaridade elemento a elemento de dois vetores é alta, e vice‑versa.
Este exercício faz parte do curso
Machine Translation with Keras
Instruções do exercício
- Imprima o comprimento de
cat_vectorusando o atributondarray.size. - Calcule e imprima a similaridade entre
cat_vectorewindow_vectorusandocosine_similarity. - Calcule e imprima a similaridade entre
cat_vectoredog_vectorusandocosine_similarity.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
from sklearn.metrics.pairwise import cosine_similarity
# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)
# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)
# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))