ComeçarComece de graça

NER com spaCy

O reconhecimento de entidades nomeadas (Named Entity Recognition — NER) ajuda você a identificar facilmente elementos-chave de um documento, como nomes de pessoas e lugares. Ele ajuda a organizar dados não estruturados e a detectar informações importantes, o que é crucial quando você lida com grandes conjuntos de dados. Neste exercício, você vai praticar Named Entity Recognition.

en_core_web_sm já foi carregado como nlp. Três comentários do conjunto de dados Airline Travel Information System (ATIS) foram fornecidos em uma lista chamada texts.

Este exercício faz parte do curso

Processamento de Linguagem Natural com spaCy

Ver curso

Instruções do exercício

  • Monte documents, uma lista com todos os containers Doc para cada texto em texts usando list comprehension.
  • Para cada container doc, imprima o texto de cada entidade e o respectivo rótulo iterando por doc.ents.
  • Imprima o texto do sexto token e o tipo de entidade do segundo container Doc.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Compile a list of all Doc containers of texts
documents = [____ for text in texts]

# Print the entity text and label for the entities in each document
for doc in documents:
    print([(____, ____) for ent in ____])
    
# Print the 6th token's text and entity type of the second document
print("\nText:", documents[1][5].____, "| Entity type: ", documents[1][5].____)
Editar e executar o código