Entrenar varias etiquetas
Aquí tienes una pequeña muestra de un conjunto de datos creado para entrenar un nuevo tipo de entidad WEBSITE. El conjunto de datos original contiene unos pocos miles de oraciones. En este ejercicio, vas a hacer el etiquetado a mano. En la vida real, seguramente querrás automatizarlo y usar una herramienta de anotación, por ejemplo, Brat, una solución de código abierto muy popular, o Prodigy, nuestra propia herramienta de anotación que se integra con spaCy.
Después de este ejercicio ¡ya casi habrás terminado el curso! Si te ha gustado, anímate a enviarle las gracias a Ines por Twitter: ¡le hará ilusión! Tweet to Ines
Este ejercicio forma parte del curso
NLP avanzado con spaCy
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
TRAINING_DATA = [
("Reddit partners with Patreon to help creators build communities",
{'entities': [(____, ____, 'WEBSITE'), (____, ____, 'WEBSITE')]}),
("PewDiePie smashes YouTube record",
{'entities': [(____, ____, 'WEBSITE')]}),
("Reddit founder Alexis Ohanian gave away two Metallica tickets to fans",
{'entities': [(____, ___, 'WEBSITE')]}),
# And so on...
]