NER com spaCy
O reconhecimento de entidades nomeadas (Named Entity Recognition — NER) ajuda você a identificar facilmente elementos-chave de um documento, como nomes de pessoas e lugares. Ele ajuda a organizar dados não estruturados e a detectar informações importantes, o que é crucial quando você lida com grandes conjuntos de dados. Neste exercício, você vai praticar Named Entity Recognition.
en_core_web_sm já foi carregado como nlp. Três comentários do conjunto de dados Airline Travel Information System (ATIS) foram fornecidos em uma lista chamada texts.
Este exercício faz parte do curso
Processamento de Linguagem Natural com spaCy
Instruções do exercício
- Monte
documents, uma lista com todos os containersDocpara cada texto emtextsusando list comprehension. - Para cada container
doc, imprima o texto de cada entidade e o respectivo rótulo iterando pordoc.ents. - Imprima o texto do sexto token e o tipo de entidade do segundo container
Doc.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Compile a list of all Doc containers of texts
documents = [____ for text in texts]
# Print the entity text and label for the entities in each document
for doc in documents:
print([(____, ____) for ent in ____])
# Print the 6th token's text and entity type of the second document
print("\nText:", documents[1][5].____, "| Entity type: ", documents[1][5].____)