Estrazione di paesi e relazioni

Nell'esercizio precedente hai scritto uno script usando il PhraseMatcher di spaCy per trovare i nomi dei paesi nel testo. Usiamo quel matcher dei paesi su un testo più lungo, analizziamo la sintassi e aggiorniamo le entità del documento con i paesi trovati. L'oggetto nlp è già stato creato.

Il testo è disponibile nella variabile text, il PhraseMatcher con i pattern dei paesi nella variabile matcher. La classe Span è già stata importata.

Questo esercizio fa parte del corso

NLP avanzato con spaCy

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create a doc and find matches in it
doc = ____

# Iterate over the matches
for match_id, start, end in matcher(doc):
    # Create a Span with the label for "GPE"
    span = ____(____, ____, ____, label=____)

    # Overwrite the doc.ents and add the span
    doc.ents = list(doc.ents) + [____]

# Print the entities in the document
print([(ent.text, ent.label_) for ent in doc.ents if ent.label_ == 'GPE'])

Modifica ed esegui il codice