Attributi lessicali

In questo esempio userai gli oggetti Doc e Token di spaCy e gli attributi lessicali per trovare le percentuali in un testo. Cercherai due token consecutivi: un numero e un simbolo di percentuale. L'oggetto nlp in inglese è già stato creato.

Questo esercizio fa parte del corso

NLP avanzato con spaCy

Visualizza corso

Istruzioni dell'esercizio

Usa l'attributo del token like_num per verificare se un token nel doc somiglia a un numero.
Ottieni il token che viene subito dopo il token corrente nel documento. L'indice del token successivo nel doc è token.i + 1.
Controlla se l'attributo text del token successivo è un simbolo di percentuale "%".

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Process the text
doc = nlp("In 1990, more than 60% of people in East Asia were in extreme poverty. Now less than 4% are.")

# Iterate over the tokens in the doc
for token in doc:
    # Check if the token resembles a number
    if ____.____:
        # Get the next token in the document
        next_token = ____[____]
        # Check if the next token's text equals '%'
        if next_token.____ == '%':
            print('Percentage found:', token.text)

Modifica ed esegui il codice