Atributos lexicais
Neste exemplo, você vai usar os objetos Doc e Token do spaCy e atributos lexicais para encontrar porcentagens em um texto. Você vai procurar dois tokens subsequentes: um número e um sinal de porcentagem. O objeto nlp em inglês já foi criado.
Este exercício faz parte do curso
NLP Avançado com spaCy
Instruções do exercício
- Use o atributo de token
like_numpara verificar se um token nodocse parece com um número. - Obtenha o token que vem após o token atual no documento. O índice do próximo token no
docétoken.i + 1. - Verifique se o atributo
textdo próximo token é um sinal de porcentagem "%".
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Process the text
doc = nlp("In 1990, more than 60% of people in East Asia were in extreme poverty. Now less than 4% are.")
# Iterate over the tokens in the doc
for token in doc:
# Check if the token resembles a number
if ____.____:
# Get the next token in the document
next_token = ____[____]
# Check if the next token's text equals '%'
if next_token.____ == '%':
print('Percentage found:', token.text)