Addestrare più etichette
Ecco un piccolo campione di un insieme di dati creato per addestrare un nuovo tipo di entità WEBSITE. L'insieme di dati originale contiene alcune migliaia di frasi. In questo esercizio, farai l'etichettatura a mano. Nella pratica, probabilmente vorrai automatizzare il processo e usare uno strumento di annotazione – per esempio Brat, una soluzione open-source molto diffusa, o Prodigy, il nostro strumento di annotazione che si integra con spaCy.
Dopo questo esercizio sarai quasi alla fine del corso! Se ti è piaciuto, puoi inviare un grazie a Ines su Twitter: lo apprezzerà! Tweet a Ines
Questo esercizio fa parte del corso
NLP avanzato con spaCy
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
TRAINING_DATA = [
("Reddit partners with Patreon to help creators build communities",
{'entities': [(____, ____, 'WEBSITE'), (____, ____, 'WEBSITE')]}),
("PewDiePie smashes YouTube record",
{'entities': [(____, ____, 'WEBSITE')]}),
("Reddit founder Alexis Ohanian gave away two Metallica tickets to fans",
{'entities': [(____, ___, 'WEBSITE')]}),
# And so on...
]