Pasos de preparación del entrenamiento
Antes y durante el entrenamiento de un modelo de spaCy, necesitarás (1) desactivar otros componentes del pipeline para entrenar solo el componente previsto y (2) convertir un contenedor Doc de un punto de datos de entrenamiento y sus annotations correspondientes en una clase Example.
En este ejercicio, practicarás estos dos pasos usando un modelo pre-cargado en_core_web_sm, accesible como nlp. La clase Example ya está importada y también tienes disponible una cadena text y las annotations relacionadas.
Este ejercicio forma parte del curso
Procesamiento del Lenguaje Natural con spaCy
Instrucciones del ejercicio
- Desactiva todos los componentes del pipeline del modelo
nlpexceptoner. - Convierte una cadena
texty susannotationsal formato correcto utilizable para el entrenamiento.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
nlp = spacy.load("en_core_web_sm")
# Disable all pipeline components of except `ner`
other_pipes = [____ for ____ in nlp.____ if ____ != 'ner']
nlp.____(*other_pipes)
# Convert a text and its annotations to the correct format usable for training
doc = nlp.____(text)
example = Example.____(____, ____)
print("Example object for training: \n", example.to_dict())