Medindo a similaridade entre vetores de palavras

Nesta lição, você vai entender o poder dos vetores de palavras usando vetores treinados no mundo real. Estes são vetores extraídos de uma lista publicada pelo grupo Stanford NLP. Um vetor de palavra é uma sequência (ou vetor) de valores numéricos. Por exemplo, dog = (0.31, 0.92, 0.13)

A distância entre vetores de palavras pode ser medida usando uma métrica de similaridade par a par. Aqui, vamos usar sklearn.metrics.pairwise.cosine_similarity. A similaridade do cosseno gera valores mais altos quando a similaridade elemento a elemento de dois vetores é alta, e vice‑versa.

Este exercicio faz parte do curso

Machine Translation with Keras

Ver curso

Instruções do exercicio

Imprima o comprimento de cat_vector usando o atributo ndarray.size.
Calcule e imprima a similaridade entre cat_vector e window_vector usando cosine_similarity.
Calcule e imprima a similaridade entre cat_vector e dog_vector usando cosine_similarity.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

from sklearn.metrics.pairwise import cosine_similarity

# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)

# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)

# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))

Editar e Executar Código