Best practices voor datastructuren
De code in dit voorbeeld probeert een tekst te analyseren en alle eigennamen te verzamelen. Als het token na de eigennaam een werkwoord is, moet dat ook worden meegenomen. Er is al een doc-object gemaakt.
# Get all tokens and part-of-speech tags
pos_tags = [token.pos_ for token in doc]
for index, pos in enumerate(pos_tags):
# Check if the current token is a proper noun
if pos == 'PROPN':
# Check if the next token is a verb
if pos_tags[index + 1] == 'VERB':
print('Found a verb after a proper noun!')
Deze oefening maakt deel uit van de cursus
Geavanceerde NLP met spaCy
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen