Atributos léxicos

En este ejemplo, vas a usar los objetos Doc y Token de spaCy, y los atributos léxicos para encontrar porcentajes en un texto. Buscarás dos tokens consecutivos: un número y un signo de porcentaje. El objeto nlp en inglés ya está creado.

Este ejercicio forma parte del curso

NLP avanzado con spaCy

Ver curso

Instrucciones del ejercicio

Usa el atributo de token like_num para comprobar si un token en el doc se parece a un número.
Obtén el token que viene a continuación del token actual en el documento. El índice del siguiente token en el doc es token.i + 1.
Comprueba si el atributo text del siguiente token es un signo de porcentaje "%".

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Process the text
doc = nlp("In 1990, more than 60% of people in East Asia were in extreme poverty. Now less than 4% are.")

# Iterate over the tokens in the doc
for token in doc:
    # Check if the token resembles a number
    if ____.____:
        # Get the next token in the document
        next_token = ____[____]
        # Check if the next token's text equals '%'
        if next_token.____ == '%':
            print('Percentage found:', token.text)

Editar y ejecutar código