Entrenar varias etiquetas

Aquí tienes una pequeña muestra de un conjunto de datos creado para entrenar un nuevo tipo de entidad WEBSITE. El conjunto de datos original contiene unos pocos miles de oraciones. En este ejercicio, vas a hacer el etiquetado a mano. En la vida real, seguramente querrás automatizarlo y usar una herramienta de anotación, por ejemplo, Brat, una solución de código abierto muy popular, o Prodigy, nuestra propia herramienta de anotación que se integra con spaCy.

Después de este ejercicio ¡ya casi habrás terminado el curso! Si te ha gustado, anímate a enviarle las gracias a Ines por Twitter: ¡le hará ilusión! Tweet to Ines

Este ejercicio forma parte del curso

NLP avanzado con spaCy

Ver curso

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

TRAINING_DATA = [
    ("Reddit partners with Patreon to help creators build communities", 
     {'entities': [(____, ____, 'WEBSITE'), (____, ____, 'WEBSITE')]}),
  
    ("PewDiePie smashes YouTube record", 
     {'entities': [(____, ____, 'WEBSITE')]}),
  
    ("Reddit founder Alexis Ohanian gave away two Metallica tickets to fans", 
     {'entities': [(____, ___, 'WEBSITE')]}),
    # And so on...
]

Editar y ejecutar código