Estrazione di paesi e relazioni
Nell'esercizio precedente hai scritto uno script usando il PhraseMatcher di spaCy per trovare i nomi dei paesi nel testo. Usiamo quel matcher dei paesi su un testo più lungo, analizziamo la sintassi e aggiorniamo le entità del documento con i paesi trovati. L'oggetto nlp è già stato creato.
Il testo è disponibile nella variabile text, il PhraseMatcher con i pattern dei paesi nella variabile matcher. La classe Span è già stata importata.
Questo esercizio fa parte del corso
NLP avanzato con spaCy
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a doc and find matches in it
doc = ____
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Create a Span with the label for "GPE"
span = ____(____, ____, ____, label=____)
# Overwrite the doc.ents and add the span
doc.ents = list(doc.ents) + [____]
# Print the entities in the document
print([(ent.text, ent.label_) for ent in doc.ents if ent.label_ == 'GPE'])