Spanische NER mit polyglot

Du setzt deine Erkundung von polyglot jetzt mit einigen spanischen Annotationen fort. Dieser Artikel stammt nicht aus einer Zeitung und ist damit dein erstes Beispiel für einen eher blogartigen Text. Wie, glaubst du, wirkt sich das auf das Finden von Entitäten aus?

Das Text-Objekt wurde als txt erstellt, und jede Entität wurde ausgegeben, wie du in der IPython Shell sehen kannst.

Deine konkrete Aufgabe ist herauszufinden, wie viele der Entitäten die Wörter "Márquez" oder "Gabo" enthalten – sie beziehen sich in unterschiedlicher Form auf dieselbe Person!

Diese Übung ist Teil des Kurses

<Kurs>Einführung in Natural Language Processing mit Python</Kurs>

Kurs ansehen

Übungsanweisungen

Iteriere über alle Entitäten von txt und verwende ent als deine Iterationsvariable.
Prüfe, ob die Entität "Márquez" oder "Gabo" enthält. Falls ja, erhöhe count. Vergiss nicht, das akzentuierte á in "Márquez" zu berücksichtigen!
Klicke auf 'Antworten', um zu sehen, welcher Prozentsatz der Entitäten sich auf Gabriel García Márquez (alias Gabo) bezieht.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Initialize the count variable: count
count = 0

# Iterate over all the entities
____
    # Check whether the entity contains 'Márquez' or 'Gabo'
    ____
        # Increment count
        ____

# Print count
print(count)

# Calculate the percentage of entities that refer to "Gabo": percentage
percentage = count / len(txt.entities)
print(percentage)

Code bearbeiten und ausführen