Palavras semelhantes em um vocabulário
Encontrar termos semanticamente semelhantes tem várias aplicações em recuperação de informação. Neste exercício, você vai praticar como encontrar o termo mais semanticamente semelhante à palavra computer no vocabulário do modelo en_core_web_md.
O vetor da palavra computer já foi extraído e está armazenado em word_vector. O modelo en_core_web_md já está carregado como nlp, e o pacote NumPy está carregado como np.
Você pode usar a função .most_similar() do objeto nlp.vocab.vectors para encontrar os termos mais semanticamente semelhantes. Usar [0][0] para indexar a saída dessa função retornará os IDs das palavras dos termos semanticamente semelhantes. nlp.vocab.strings[<a given word>] pode ser usado para encontrar o ID de uma palavra e, de forma semelhante, pode retornar a palavra associada a um determinado ID de palavra.
Este exercício faz parte do curso
Processamento de Linguagem Natural com spaCy
Instruções do exercício
- Encontre o termo mais semanticamente semelhante no vocabulário do
en_core_web_md. - Encontre a lista de palavras semelhantes a partir dos IDs das palavras dos termos semelhantes.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Find the most similar word to the word computer
most_similar_words = nlp.vocab.vectors.____(np.asarray([____]), n = 1)
# Find the list of similar words given the word IDs
words = [nlp.____.____[____] for w in most_similar_words[0][0]]
print(words)