NER com spaCy
O reconhecimento de entidades nomeadas (Named Entity Recognition — NER) ajuda você a identificar facilmente elementos-chave de um documento, como nomes de pessoas e lugares. Ele ajuda a organizar dados não estruturados e a detectar informações importantes, o que é crucial quando você lida com grandes conjuntos de dados. Neste exercício, você vai praticar Named Entity Recognition.
en_core_web_sm já foi carregado como nlp. Três comentários do conjunto de dados Airline Travel Information System (ATIS) foram fornecidos em uma lista chamada texts.
Este exercicio faz parte do curso
Processamento de Linguagem Natural com spaCy
Instruções do exercicio
- Monte
documents, uma lista com todos os containersDocpara cada texto emtextsusando list comprehension. - Para cada container
doc, imprima o texto de cada entidade e o respectivo rótulo iterando pordoc.ents. - Imprima o texto do sexto token e o tipo de entidade do segundo container
Doc.
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
# Compile a list of all Doc containers of texts
documents = [____ for text in texts]
# Print the entity text and label for the entities in each document
for doc in documents:
print([(____, ____) for ent in ____])
# Print the 6th token's text and entity type of the second document
print("\nText:", documents[1][5].____, "| Entity type: ", documents[1][5].____)