Etapas de preparação do treinamento

Antes e durante o treinamento de um modelo do spaCy, você vai precisar (1) desativar outros componentes do pipeline para treinar apenas o componente desejado e (2) converter um contêiner Doc de um ponto de dados de treinamento e suas annotations correspondentes em uma classe Example.

Neste exercício, você vai praticar essas duas etapas usando um modelo en_core_web_sm pré-carregado, acessível como nlp. A classe Example já foi importada e uma string text e as annotations relacionadas também estão disponíveis para você usar.

Este exercicio faz parte do curso

Processamento de Linguagem Natural com spaCy

Ver curso

Instruções do exercicio

Desative todos os componentes do pipeline do modelo nlp, exceto ner.
Converta uma string text e suas annotations para o formato correto utilizável no treinamento.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

nlp = spacy.load("en_core_web_sm")

# Disable all pipeline components of  except `ner`
other_pipes = [____ for ____ in nlp.____ if ____ != 'ner']
nlp.____(*other_pipes)

# Convert a text and its annotations to the correct format usable for training
doc = nlp.____(text)
example = Example.____(____, ____)
print("Example object for training: \n", example.to_dict())

Editar e Executar Código