NER con spaCy

Il Named Entity Recognition (NER) ti aiuta a identificare facilmente gli elementi chiave di un documento, come nomi di persone e luoghi. È utile per organizzare dati non strutturati e rilevare informazioni importanti, fondamentale quando lavori con grandi insiemi di dati. In questo esercizio, farai pratica con il Named Entity Recognition.

en_core_web_sm è già stato caricato come nlp. Tre commenti dal dataset Airline Travel Information System (ATIS) sono stati forniti in una lista chiamata texts.

Questo esercizio fa parte del corso

Natural Language Processing con spaCy

Visualizza corso

Istruzioni dell'esercizio

Crea documents, una lista di tutti i contenitori Doc per ciascun testo in texts usando una list comprehension.
Per ogni contenitore doc, stampa il testo di ogni entità e l'etichetta corrispondente iterando su doc.ents.
Stampa il testo del sesto token e il tipo di entità del secondo contenitore Doc.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Compile a list of all Doc containers of texts
documents = [____ for text in texts]

# Print the entity text and label for the entities in each document
for doc in documents:
    print([(____, ____) for ent in ____])
    
# Print the 6th token's text and entity type of the second document
print("\nText:", documents[1][5].____, "| Entity type: ", documents[1][5].____)

Modifica ed esegui il codice