ComeçarComece de graça

Medindo a semelhança entre vetores de palavras

Nesta aula, vamos entender o poder dos vetores de palavras usando vetores de palavras treinados no mundo real. Esses são vetores de palavras que a gente pegou de uma lista de vetores de palavras que o grupo de NLP da Stanford publicou. Um vetor de palavras é uma sequência ou um vetor de valores numéricos. Por exemplo: dog = (0.31, 0.92, 0.13)

A distância entre vetores de palavras pode ser medida usando uma métrica de similaridade em pares. Aqui, vamos usar sklearn.metrics.pairwise.cosine_similarity. A similaridade coseno dá valores mais altos quando a similaridade entre os elementos de dois vetores é alta e vice-versa.

Este exercício faz parte do curso

Tradução automática com Keras

Ver curso

Instruções do exercício

  • Imprima o comprimento do objeto cat_vector usando o atributo ndarray.size.
  • Calcule e imprima a semelhança entre cat_vector e window_vector usando cosine_similarity.
  • Calcule e imprima a semelhança entre cat_vector e dog_vector usando cosine_similarity.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

from sklearn.metrics.pairwise import cosine_similarity

# Print the length of the cat_vector
print('Length of the cat_vector: ', ____.____)

# Compute and print the similarity between cat and window vectors
dist_cat_window = ____(____, window_vector)
print('Similarity(cat, window): ', ____)

# Compute and print the similarity between cat and dog vectors
print('Similarity(cat,dog): ', ____(____, ____))
Editar e executar o código