Etapas de preparação do treinamento
Antes e durante o treinamento de um modelo do spaCy, você vai precisar (1) desativar outros componentes do pipeline para treinar apenas o componente desejado e (2) converter um contêiner Doc de um ponto de dados de treinamento e suas annotations correspondentes em uma classe Example.
Neste exercício, você vai praticar essas duas etapas usando um modelo en_core_web_sm pré-carregado, acessível como nlp. A classe Example já foi importada e uma string text e as annotations relacionadas também estão disponíveis para você usar.
Este exercício faz parte do curso
Processamento de Linguagem Natural com spaCy
Instruções do exercício
- Desative todos os componentes do pipeline do modelo
nlp, excetoner. - Converta uma string
texte suasannotationspara o formato correto utilizável no treinamento.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
nlp = spacy.load("en_core_web_sm")
# Disable all pipeline components of except `ner`
other_pipes = [____ for ____ in nlp.____ if ____ != 'ner']
nlp.____(*other_pipes)
# Convert a text and its annotations to the correct format usable for training
doc = nlp.____(text)
example = Example.____(____, ____)
print("Example object for training: \n", example.to_dict())