Palavras semelhantes em um vocabulário

Encontrar termos semanticamente semelhantes tem várias aplicações em recuperação de informação. Neste exercício, você vai praticar como encontrar o termo mais semanticamente semelhante à palavra computer no vocabulário do modelo en_core_web_md.

O vetor da palavra computer já foi extraído e está armazenado em word_vector. O modelo en_core_web_md já está carregado como nlp, e o pacote NumPy está carregado como np.

Você pode usar a função .most_similar() do objeto nlp.vocab.vectors para encontrar os termos mais semanticamente semelhantes. Usar [0][0] para indexar a saída dessa função retornará os IDs das palavras dos termos semanticamente semelhantes. nlp.vocab.strings[<a given word>] pode ser usado para encontrar o ID de uma palavra e, de forma semelhante, pode retornar a palavra associada a um determinado ID de palavra.

Este exercicio faz parte do curso

Processamento de Linguagem Natural com spaCy

Ver curso

Instruções do exercicio

Encontre o termo mais semanticamente semelhante no vocabulário do en_core_web_md.
Encontre a lista de palavras semelhantes a partir dos IDs das palavras dos termos semelhantes.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Find the most similar word to the word computer
most_similar_words = nlp.vocab.vectors.____(np.asarray([____]), n = 1)

# Find the list of similar words given the word IDs
words = [nlp.____.____[____] for w in most_similar_words[0][0]]
print(words)

Editar e Executar Código