Marcação de POS com spaCy
Neste exercício, você vai praticar marcação de POS (part-of-speech). A marcação de POS é uma ferramenta útil em NLP, pois permite que algoritmos entendam a estrutura gramatical de uma frase e confirmem palavras que têm múltiplos significados, como watch e play.
Para este exercício, o en_core_web_sm já foi carregado para você como nlp. Três comentários do conjunto de dados Airline Travel Information System (ATIS) foram fornecidos em uma lista chamada texts.
Este exercício faz parte do curso
Processamento de Linguagem Natural com spaCy
Instruções do exercício
- Compile
documents, uma lista com todos os contêineresdocpara cada texto na listatextsusando list comprehension. - Para cada contêiner
doc, imprima o texto de cada token e sua classe gramatical (POS) correspondente, iterando pordocumentse pelos tokens de cada contêinerdocusando um loop for aninhado.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Compile a list of all Doc containers of texts
documents = [____(text) for text in texts]
# Print token texts and POS tags for each Doc container
for doc in documents:
for ____ in doc:
print("Text: ", ____, "| POS tag: ", ____)
print("\n")