Spanische NER mit polyglot
Du setzt deine Erkundung von polyglot jetzt mit einigen spanischen Annotationen fort. Dieser Artikel stammt nicht aus einer Zeitung und ist damit dein erstes Beispiel für einen eher blogartigen Text. Wie, glaubst du, wirkt sich das auf das Finden von Entitäten aus?
Das Text-Objekt wurde als txt erstellt, und jede Entität wurde ausgegeben, wie du in der IPython Shell sehen kannst.
Deine konkrete Aufgabe ist herauszufinden, wie viele der Entitäten die Wörter "Márquez" oder "Gabo" enthalten – sie beziehen sich in unterschiedlicher Form auf dieselbe Person!
Diese Übung ist Teil des Kurses
Einführung in Natural Language Processing mit Python
Anleitung zur Übung
- Iteriere über alle Entitäten von
txtund verwendeentals deine Iterationsvariable. - Prüfe, ob die Entität
"Márquez"oder"Gabo"enthält. Falls ja, erhöhecount. Vergiss nicht, das akzentuierteáin"Márquez"zu berücksichtigen! - Klicke auf 'Antworten', um zu sehen, welcher Prozentsatz der Entitäten sich auf Gabriel García Márquez (alias Gabo) bezieht.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Initialize the count variable: count
count = 0
# Iterate over all the entities
____
# Check whether the entity contains 'Márquez' or 'Gabo'
____
# Increment count
____
# Print count
print(count)
# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)