Dados de treino compatíveis
Lembre-se de que você não pode passar o texto bruto diretamente para o spaCy. Em vez disso, é preciso criar um objeto Example para cada exemplo de treino. Neste exercício, você vai praticar a conversão de um training_data com uma única frase anotada em uma lista de objetos Example.
O modelo en_core_web_sm já foi importado e está pronto para uso como nlp. A classe Example também foi importada para você usar.
Este exercício faz parte do curso
Processamento de Linguagem Natural com spaCy
Instruções do exercício
- Itere pelo texto e pelas anotações em
training_data, converta o texto em um contêinerDoce armazene-o emdoc. - Crie um objeto
Exampleusando o objetodoce as anotações de cada ponto de treino, e armazene-o emexample_sentence. - Adicione
example_sentencea uma listaall_examples.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
example_text = 'A patient with chest pain had hyperthyroidism.'
training_data = [(example_text, {'entities': [(15, 25, 'SYMPTOM'), (30, 45, 'DISEASE')]})]
all_examples = []
# Iterate through text and annotations and convert text to a Doc container
for text, annotations in training_data:
doc = nlp(____)
# Create an Example object from the doc contianer and annotations
example_sentence = ____.____(doc, ____)
print(example_sentence.to_dict(), "\n")
# Append the Example object to the list of all examples
all_examples.append(____)
print("Number of formatted training data: ", len(____))