Segmentazione in frasi con spaCy

In questo esercizio praticherai la segmentazione in frasi. Nel NLP, suddividere un documento nelle sue frasi è un’operazione di base molto utile. È uno dei primi passaggi in molti compiti NLP più complessi, come il riconoscimento di entità nominate. Inoltre, rilevare il numero di frasi può dare qualche indicazione sulla quantità di informazioni fornite dal testo.

Hai a disposizione dieci recensioni di cibo nell’elenco chiamato texts.

Il modello en_core_web_sm è già stato caricato come nlp e .

Questo esercizio fa parte del corso

Natural Language Processing con spaCy

Visualizza corso

Istruzioni dell'esercizio

Esegui il modello spaCy su ciascun elemento della lista texts per creare documents, un elenco di tutti i contenitori Doc.
Estrai le frasi di ciascun contenitore doc iterando sulla lista documents e aggiungile a una lista chiamata sentences.
Conta il numero di frasi in ciascun contenitore doc usando la lista sentences.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Generating a documents list of all Doc containers
documents = [____(text) for text in texts]

# Iterate through documents and append sentences in each doc to the sentences list
sentences = []
for doc in documents:
  sentences.append([s for s in ____.____])
  
# Find number of sentences per each doc container
print([len(____) for s in sentences])

Modifica ed esegui il codice