NER con spaCy
Il Named Entity Recognition (NER) ti aiuta a identificare facilmente gli elementi chiave di un documento, come nomi di persone e luoghi. È utile per organizzare dati non strutturati e rilevare informazioni importanti, fondamentale quando lavori con grandi insiemi di dati. In questo esercizio, farai pratica con il Named Entity Recognition.
en_core_web_sm è già stato caricato come nlp. Tre commenti dal dataset Airline Travel Information System (ATIS) sono stati forniti in una lista chiamata texts.
Questo esercizio fa parte del corso
Natural Language Processing con spaCy
Istruzioni dell'esercizio
- Crea
documents, una lista di tutti i contenitoriDocper ciascun testo intextsusando una list comprehension. - Per ogni contenitore
doc, stampa il testo di ogni entità e l'etichetta corrispondente iterando sudoc.ents. - Stampa il testo del sesto token e il tipo di entità del secondo contenitore
Doc.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Compile a list of all Doc containers of texts
documents = [____ for text in texts]
# Print the entity text and label for the entities in each document
for doc in documents:
print([(____, ____) for ent in ____])
# Print the 6th token's text and entity type of the second document
print("\nText:", documents[1][5].____, "| Entity type: ", documents[1][5].____)