Best practices voor datastructuren

De code in dit voorbeeld probeert een tekst te analyseren en alle eigennamen te verzamelen. Als het token na de eigennaam een werkwoord is, moet dat ook worden meegenomen. Er is al een doc-object gemaakt.

# Get all tokens and part-of-speech tags
pos_tags = [token.pos_ for token in doc]

for index, pos in enumerate(pos_tags):
    # Check if the current token is a proper noun
    if pos == 'PROPN':
        # Check if the next token is a verb
        if pos_tags[index + 1] == 'VERB':
            print('Found a verb after a proper noun!')

Deze oefening maakt deel uit van de cursus

Geavanceerde NLP met spaCy

Bekijk cursus

Interactieve oefening met praktijkervaring

Zet theorie om in actie met een van onze interactieve oefeningen

Begin oefening