Datos de entrenamiento compatibles
Recuerda que no puedes pasar el texto en bruto directamente a spaCy. En su lugar, necesitas crear un objeto Example para cada ejemplo de entrenamiento. En este ejercicio, practicarás cómo convertir un training_data con una sola frase anotada en una lista de objetos Example.
El modelo en_core_web_sm ya está importado y listo para usarse como nlp. La clase Example también está importada para que la utilices.
Este ejercicio forma parte del curso
Procesamiento del Lenguaje Natural con spaCy
Instrucciones del ejercicio
- Recorre el texto y las anotaciones en
training_data, convierte el texto en un contenedorDocy guárdalo endoc. - Crea un objeto
Exampleusando el objetodocy las anotaciones de cada punto de entrenamiento, y guárdalo enexample_sentence. - Añade
example_sentencea una listaall_examples.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
example_text = 'A patient with chest pain had hyperthyroidism.'
training_data = [(example_text, {'entities': [(15, 25, 'SYMPTOM'), (30, 45, 'DISEASE')]})]
all_examples = []
# Iterate through text and annotations and convert text to a Doc container
for text, annotations in training_data:
doc = nlp(____)
# Create an Example object from the doc contianer and annotations
example_sentence = ____.____(doc, ____)
print(example_sentence.to_dict(), "\n")
# Append the Example object to the list of all examples
all_examples.append(____)
print("Number of formatted training data: ", len(____))