Elaborazione del testo con spaCy

Ogni applicazione di NLP è composta da diversi passaggi di elaborazione del testo. Hai già imparato alcuni di questi passaggi, tra cui tokenizzazione, lemmatizzazione, segmentazione in frasi e riconoscimento di entità denominate.

spaCy NLP Pipeline

In questo esercizio, continuerai a fare pratica con i passaggi di elaborazione del testo in spaCy, come suddividere il testo in frasi ed estrarre le entità denominate. Per questo esercizio userai le prime cinque recensioni del dataset Amazon Fine Food Reviews. Puoi accedere a queste recensioni tramite l'oggetto texts.

Il modello en_core_web_sm è già stato caricato e puoi accedervi tramite nlp. Anche l'elenco dei contenitori Doc per ciascun elemento in texts è pre-caricato ed è accessibile in documents.

Questo esercizio fa parte del corso

Natural Language Processing con spaCy

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create a list to store sentences of each Doc container in documents
sentences = [[____ for sent in doc.____] for doc in documents]

# Print number of sentences in each Doc container in documents
num_sentences = [len(____) for s in sentences]
print("Number of sentences in documents:\n", ____)

Modifica ed esegui il codice