Länder und Beziehungen extrahieren
In der vorherigen Übung hast du ein Skript mit spaCys PhraseMatcher geschrieben, um Ländernamen im Text zu finden. Lass uns diesen Country-Matcher jetzt auf einen längeren Text anwenden, die Syntax analysieren und die Entitäten des Dokuments mit den gefundenen Ländern aktualisieren. Das Objekt nlp wurde bereits erstellt.
Der Text steht dir als Variable text zur Verfügung, der PhraseMatcher mit den Länder-Patterns als Variable matcher. Die Klasse Span wurde bereits importiert.
Diese Übung ist Teil des Kurses
Fortgeschrittenes NLP mit spaCy
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a doc and find matches in it
doc = ____
# Iterate over the matches
for match_id, start, end in matcher(doc):
# Create a Span with the label for "GPE"
span = ____(____, ____, ____, label=____)
# Overwrite the doc.ents and add the span
doc.ents = list(doc.ents) + [____]
# Print the entities in the document
print([(ent.text, ent.label_) for ent in doc.ents if ent.label_ == 'GPE'])