Oefenen met grafieken
In deze oefening gebruik je enkele geëxtraheerde benoemde entiteiten en hun categorieën uit een reeks krantenartikelen om de diversiteit aan entiteitstypen in de artikelen in kaart te brengen.
Je gebruikt een defaultdict met de naam ner_categories, waarbij de keys elk type entiteitsgroep voorstellen en de values tellen hoe vaak elk entiteitstype voorkomt. Je hebt een lijst met gechunkte zinnen, chunked_sentences, vergelijkbaar met de vorige oefening, maar dit keer met niet-binaire categorienamen.
Je kunt hasattr() gebruiken om te bepalen of elke chunk een 'label' heeft en vervolgens simpelweg de .label()-methode van de chunk gebruiken als dictionarykey.
Deze oefening maakt deel uit van de cursus
Introductie tot Natural Language Processing in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the defaultdict: ner_categories
ner_categories = ____