Zelfstandige naamwoorden tellen in een tekst

In deze oefening schrijven we twee functies, nouns() en proper_nouns(), die respectievelijk het aantal gewone zelfstandige naamwoorden en eigennaamwoorden in een tekst tellen.

Deze functies nemen een stuk tekst en maken een lijst met de POS-tags voor elk woord. Daarna geven ze het aantal eigennamen/andere zelfstandige naamwoorden in de tekst terug. In de volgende oefening gebruiken we deze functies om interessante inzichten over fake news te genereren.

Het model en_core_web_sm is in deze oefening al als nlp geladen.

Deze oefening maakt deel uit van de cursus

Feature Engineering voor NLP in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

nlp = spacy.load('en_core_web_sm')

# Returns number of proper nouns
def proper_nouns(text, model=nlp):
  	# Create doc object
    doc = model(text)
    # Generate list of POS tags
    pos = [token.pos_ for token in doc]
    
    # Return number of proper nouns
    return ____.____(____)

print(proper_nouns("Abdul, Bill and Cathy went to the market to buy apples.", nlp))

Code bewerken en uitvoeren