Charting Praxis
In dieser Übung verwendest du einige extrahierte benannte Entitäten und ihre Gruppierungen aus einer Reihe von Zeitungsartikeln, um die Vielfalt der benannten Entitätstypen in den Artikeln darzustellen.
Du verwendest eine defaultdict
mit dem Namen ner_categories
, deren Schlüssel jeden Entitätsgruppentyp repräsentieren und deren Werte die Anzahl der verschiedenen Entitätsgruppentypen zählen. Du hast eine gechunkte Satzliste namens chunked_sentences
, ähnlich wie in der letzten Übung, aber diesmal mit nicht-binären Kategorienamen.
Du kannst hasattr()
verwenden, um festzustellen, ob jeder Chunk eine 'label'
hat und dann einfach die .label()
Methode des Chunks als Wörterbuchschlüssel verwenden.
Diese Übung ist Teil des Kurses
Einführung in die natürliche Sprachverarbeitung in Python
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Create the defaultdict: ner_categories
ner_categories = ____