Atributos léxicos
En este ejemplo, vas a usar los objetos Doc y Token de spaCy, y los atributos léxicos para encontrar porcentajes en un texto. Buscarás dos tokens consecutivos: un número y un signo de porcentaje. El objeto nlp en inglés ya está creado.
Este ejercicio forma parte del curso
NLP avanzado con spaCy
Instrucciones del ejercicio
- Usa el atributo de token
like_numpara comprobar si un token en eldocse parece a un número. - Obtén el token que viene a continuación del token actual en el documento. El índice del siguiente token en el
docestoken.i + 1. - Comprueba si el atributo
textdel siguiente token es un signo de porcentaje "%".
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Process the text
doc = nlp("In 1990, more than 60% of people in East Asia were in extreme poverty. Now less than 4% are.")
# Iterate over the tokens in the doc
for token in doc:
# Check if the token resembles a number
if ____.____:
# Get the next token in the document
next_token = ____[____]
# Check if the next token's text equals '%'
if next_token.____ == '%':
print('Percentage found:', token.text)