ComeçarComece de graça

Marcação de POS com spaCy

Neste exercício, você vai praticar marcação de POS (part-of-speech). A marcação de POS é uma ferramenta útil em NLP, pois permite que algoritmos entendam a estrutura gramatical de uma frase e confirmem palavras que têm múltiplos significados, como watch e play.

Para este exercício, o en_core_web_sm já foi carregado para você como nlp. Três comentários do conjunto de dados Airline Travel Information System (ATIS) foram fornecidos em uma lista chamada texts.

Este exercício faz parte do curso

Processamento de Linguagem Natural com spaCy

Ver curso

Instruções do exercício

  • Compile documents, uma lista com todos os contêineres doc para cada texto na lista texts usando list comprehension.
  • Para cada contêiner doc, imprima o texto de cada token e sua classe gramatical (POS) correspondente, iterando por documents e pelos tokens de cada contêiner doc usando um loop for aninhado.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Compile a list of all Doc containers of texts
documents = [____(text) for text in texts]

# Print token texts and POS tags for each Doc container
for doc in documents:
    for ____ in doc:
        print("Text: ", ____, "| POS tag: ", ____)
    print("\n")
Editar e executar o código