Zelfstandige naamwoorden tellen in een tekst
In deze oefening schrijven we twee functies, nouns() en proper_nouns(), die respectievelijk het aantal gewone zelfstandige naamwoorden en eigennaamwoorden in een tekst tellen.
Deze functies nemen een stuk tekst en maken een lijst met de POS-tags voor elk woord. Daarna geven ze het aantal eigennamen/andere zelfstandige naamwoorden in de tekst terug. In de volgende oefening gebruiken we deze functies om interessante inzichten over fake news te genereren.
Het model en_core_web_sm is in deze oefening al als nlp geladen.
Deze oefening maakt deel uit van de cursus
Feature Engineering voor NLP in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
nlp = spacy.load('en_core_web_sm')
# Returns number of proper nouns
def proper_nouns(text, model=nlp):
# Create doc object
doc = model(text)
# Generate list of POS tags
pos = [token.pos_ for token in doc]
# Return number of proper nouns
return ____.____(____)
print(proper_nouns("Abdul, Bill and Cathy went to the market to buy apples.", nlp))