ComeçarComece de graça

Vetores de palavras no vocabulário do spaCy

O objetivo dos vetores de palavras é permitir que o computador compreenda palavras. Neste exercício, você vai praticar a extração de vetores de palavras para uma lista específica de termos.

Uma lista de palavras foi criada como words. O modelo en_core_web_md já foi importado e está disponível como nlp.

O vocabulário do modelo en_core_web_md contém 20.000 palavras. Se uma palavra não existir no vocabulário, você não conseguirá extrair seu vetor correspondente. Neste exercício, para simplificar, é garantido que todas as palavras fornecidas existem no vocabulário deste modelo.

Este exercício faz parte do curso

Processamento de Linguagem Natural com spaCy

Ver curso

Instruções do exercício

  • Extraia os IDs de todas as words fornecidas e armazene-os em uma lista ids.
  • Para cada ID em ids, armazene os dez primeiros elementos do vetor de palavras na lista word_vectors.
  • Imprima os dez primeiros elementos do primeiro vetor de palavras em word_vectors.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

words = ["like", "love"]

# IDs of all the given words
ids = [nlp.____.____[w] for w in words]

# Store the first ten elements of the word vectors for each word
word_vectors = [nlp.____.____[i][:10] for i in ids]

# Print the first ten elements of the first word vector
print(____[0])
Editar e executar o código