Spanisch NER mit Polyglott
Du wirst deine Erkundung von polyglot
jetzt mit einigen spanischen Kommentaren fortsetzen. Dieser Artikel ist nicht von einer Zeitung geschrieben, also ist er dein erstes Beispiel für einen eher blogähnlichen Text. Was denkst du, wie das bei der Suche nach Unternehmen aussieht?
Das Objekt Text
wurde als txt
erstellt, und jede Entität wurde gedruckt, wie du in der IPython Shell sehen kannst.
Deine Aufgabe ist es, herauszufinden, wie viele der Entitäten die Wörter "Márquez"
oder "Gabo"
enthalten - diese beziehen sich auf dieselbe Person auf unterschiedliche Weise!
Diese Übung ist Teil des Kurses
Einführung in die natürliche Sprachverarbeitung in Python
Anleitung zur Übung
- Iteriere über alle Entitäten von
txt
und verwendeent
als Iteratorvariable. - Prüfe, ob die Entität
"Márquez"
oder"Gabo"
enthält. Wenn dies der Fall ist, erhöhecount
. Vergiss nicht, die akzentuierteá
in"Márquez"
einzubauen! - Klicke auf "Antwort abschicken", um zu sehen, wie viel Prozent der Entitäten sich auf Gabriel García Márquez (alias Gabo) beziehen.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Initialize the count variable: count
count = 0
# Iterate over all the entities
____
# Check whether the entity contains 'Márquez' or 'Gabo'
____
# Increment count
____
# Print count
print(count)
# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)