ComeçarComece de graça

Etapas de preparação do treinamento

Antes e durante o treinamento de um modelo do spaCy, você vai precisar (1) desativar outros componentes do pipeline para treinar apenas o componente desejado e (2) converter um contêiner Doc de um ponto de dados de treinamento e suas annotations correspondentes em uma classe Example.

Neste exercício, você vai praticar essas duas etapas usando um modelo en_core_web_sm pré-carregado, acessível como nlp. A classe Example já foi importada e uma string text e as annotations relacionadas também estão disponíveis para você usar.

Este exercício faz parte do curso

Processamento de Linguagem Natural com spaCy

Ver curso

Instruções do exercício

  • Desative todos os componentes do pipeline do modelo nlp, exceto ner.
  • Converta uma string text e suas annotations para o formato correto utilizável no treinamento.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

nlp = spacy.load("en_core_web_sm")

# Disable all pipeline components of  except `ner`
other_pipes = [____ for ____ in nlp.____ if ____ != 'ner']
nlp.____(*other_pipes)

# Convert a text and its annotations to the correct format usable for training
doc = nlp.____(text)
example = Example.____(____, ____)
print("Example object for training: \n", example.to_dict())
Editar e executar o código