ComeçarComece de graça

Atributos lexicais

Neste exemplo, você vai usar os objetos Doc e Token do spaCy e atributos lexicais para encontrar porcentagens em um texto. Você vai procurar dois tokens subsequentes: um número e um sinal de porcentagem. O objeto nlp em inglês já foi criado.

Este exercício faz parte do curso

NLP Avançado com spaCy

Ver curso

Instruções do exercício

  • Use o atributo de token like_num para verificar se um token no doc se parece com um número.
  • Obtenha o token que vem após o token atual no documento. O índice do próximo token no doc é token.i + 1.
  • Verifique se o atributo text do próximo token é um sinal de porcentagem "%".

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Process the text
doc = nlp("In 1990, more than 60% of people in East Asia were in extreme poverty. Now less than 4% are.")

# Iterate over the tokens in the doc
for token in doc:
    # Check if the token resembles a number
    if ____.____:
        # Get the next token in the document
        next_token = ____[____]
        # Check if the next token's text equals '%'
        if next_token.____ == '%':
            print('Percentage found:', token.text)
Editar e executar o código