Vetores de palavras no vocabulário do spaCy
O objetivo dos vetores de palavras é permitir que o computador compreenda palavras. Neste exercício, você vai praticar a extração de vetores de palavras para uma lista específica de termos.
Uma lista de palavras foi criada como words. O modelo en_core_web_md já foi importado e está disponível como nlp.
O vocabulário do modelo en_core_web_md contém 20.000 palavras. Se uma palavra não existir no vocabulário, você não conseguirá extrair seu vetor correspondente. Neste exercício, para simplificar, é garantido que todas as palavras fornecidas existem no vocabulário deste modelo.
Este exercício faz parte do curso
Processamento de Linguagem Natural com spaCy
Instruções do exercício
- Extraia os IDs de todas as
wordsfornecidas e armazene-os em uma listaids. - Para cada ID em
ids, armazene os dez primeiros elementos do vetor de palavras na listaword_vectors. - Imprima os dez primeiros elementos do primeiro vetor de palavras em
word_vectors.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
words = ["like", "love"]
# IDs of all the given words
ids = [nlp.____.____[w] for w in words]
# Store the first ten elements of the word vectors for each word
word_vectors = [nlp.____.____[i][:10] for i in ids]
# Print the first ten elements of the first word vector
print(____[0])