Attributi lessicali
In questo esempio userai gli oggetti Doc e Token di spaCy e gli attributi lessicali per trovare le percentuali in un testo. Cercherai due token consecutivi: un numero e un simbolo di percentuale. L'oggetto nlp in inglese è già stato creato.
Questo esercizio fa parte del corso
NLP avanzato con spaCy
Istruzioni dell'esercizio
- Usa l'attributo del token
like_numper verificare se un token neldocsomiglia a un numero. - Ottieni il token che viene subito dopo il token corrente nel documento. L'indice del token successivo nel
docètoken.i + 1. - Controlla se l'attributo
textdel token successivo è un simbolo di percentuale "%".
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Process the text
doc = nlp("In 1990, more than 60% of people in East Asia were in extreme poverty. Now less than 4% are.")
# Iterate over the tokens in the doc
for token in doc:
# Check if the token resembles a number
if ____.____:
# Get the next token in the document
next_token = ____[____]
# Check if the next token's text equals '%'
if next_token.____ == '%':
print('Percentage found:', token.text)