ComenzarEmpieza gratis

Atributos léxicos

En este ejemplo, vas a usar los objetos Doc y Token de spaCy, y los atributos léxicos para encontrar porcentajes en un texto. Buscarás dos tokens consecutivos: un número y un signo de porcentaje. El objeto nlp en inglés ya está creado.

Este ejercicio forma parte del curso

NLP avanzado con spaCy

Ver curso

Instrucciones del ejercicio

  • Usa el atributo de token like_num para comprobar si un token en el doc se parece a un número.
  • Obtén el token que viene a continuación del token actual en el documento. El índice del siguiente token en el doc es token.i + 1.
  • Comprueba si el atributo text del siguiente token es un signo de porcentaje "%".

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Process the text
doc = nlp("In 1990, more than 60% of people in East Asia were in extreme poverty. Now less than 4% are.")

# Iterate over the tokens in the doc
for token in doc:
    # Check if the token resembles a number
    if ____.____:
        # Get the next token in the document
        next_token = ____[____]
        # Check if the next token's text equals '%'
        if next_token.____ == '%':
            print('Percentage found:', token.text)
Editar y ejecutar código