Passi di preparazione all'addestramento
Prima e durante l'addestramento di un modello spaCy, dovrai (1) disattivare gli altri componenti della pipeline per addestrare solo il componente desiderato e (2) convertire un contenitore Doc di un punto dati di training e le relative annotations in una classe Example.
In questo esercizio, metterai in pratica questi due passaggi usando un modello pre-caricato en_core_web_sm, accessibile come nlp. La classe Example è già importata e una stringa text con le relative annotations sono già disponibili per te.
Questo esercizio fa parte del corso
Natural Language Processing con spaCy
Istruzioni dell'esercizio
- Disattiva tutti i componenti della pipeline del modello
nlptrannener. - Converte una stringa
texte le sueannotationsnel formato corretto utilizzabile per l'addestramento.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
nlp = spacy.load("en_core_web_sm")
# Disable all pipeline components of except `ner`
other_pipes = [____ for ____ in nlp.____ if ____ != 'ner']
nlp.____(*other_pipes)
# Convert a text and its annotations to the correct format usable for training
doc = nlp.____(text)
example = Example.____(____, ____)
print("Example object for training: \n", example.to_dict())