Componenti con estensioni
Gli attributi di estensione sono particolarmente potenti se combinati con componenti personalizzati della pipeline. In questo esercizio scriverai un componente della pipeline che trova i nomi dei paesi e un attributo di estensione personalizzato che restituisce la capitale di un paese, se disponibile.
L'oggetto nlp è già stato creato e la classe Span è già importata. Un phrase matcher con tutti i paesi è disponibile nella variabile matcher. Un dizionario che mappa i paesi alle rispettive capitali è disponibile nella variabile capitals.
Questo esercizio fa parte del corso
NLP avanzato con spaCy
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
def countries_component(doc):
# Create an entity Span with the label 'GPE' for all matches
doc.ents = [____(____, ____, ____, label=____)
for match_id, start, end in matcher(doc)]
return doc
# Add the component to the pipeline
____.____(____)
print(nlp.pipe_names)