Elaborazione del testo con spaCy
Ogni applicazione di NLP è composta da diversi passaggi di elaborazione del testo. Hai già imparato alcuni di questi passaggi, tra cui tokenizzazione, lemmatizzazione, segmentazione in frasi e riconoscimento di entità denominate.
In questo esercizio, continuerai a fare pratica con i passaggi di elaborazione del testo in spaCy, come suddividere il testo in frasi ed estrarre le entità denominate. Per questo esercizio userai le prime cinque recensioni del dataset Amazon Fine Food Reviews. Puoi accedere a queste recensioni tramite l'oggetto texts.
Il modello en_core_web_sm è già stato caricato e puoi accedervi tramite nlp. Anche l'elenco dei contenitori Doc per ciascun elemento in texts è pre-caricato ed è accessibile in documents.
Questo esercizio fa parte del corso
Natural Language Processing con spaCy
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a list to store sentences of each Doc container in documents
sentences = [[____ for sent in doc.____] for doc in documents]
# Print number of sentences in each Doc container in documents
num_sentences = [len(____) for s in sentences]
print("Number of sentences in documents:\n", ____)