IniziaInizia gratis

Addestrare più etichette

Ecco un piccolo campione di un insieme di dati creato per addestrare un nuovo tipo di entità WEBSITE. L'insieme di dati originale contiene alcune migliaia di frasi. In questo esercizio, farai l'etichettatura a mano. Nella pratica, probabilmente vorrai automatizzare il processo e usare uno strumento di annotazione – per esempio Brat, una soluzione open-source molto diffusa, o Prodigy, il nostro strumento di annotazione che si integra con spaCy.

Dopo questo esercizio sarai quasi alla fine del corso! Se ti è piaciuto, puoi inviare un grazie a Ines su Twitter: lo apprezzerà! Tweet a Ines

Questo esercizio fa parte del corso

NLP avanzato con spaCy

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

TRAINING_DATA = [
    ("Reddit partners with Patreon to help creators build communities", 
     {'entities': [(____, ____, 'WEBSITE'), (____, ____, 'WEBSITE')]}),
  
    ("PewDiePie smashes YouTube record", 
     {'entities': [(____, ____, 'WEBSITE')]}),
  
    ("Reddit founder Alexis Ohanian gave away two Metallica tickets to fans", 
     {'entities': [(____, ___, 'WEBSITE')]}),
    # And so on...
]
Modifica ed esegui il codice