Segmentazione in frasi con spaCy
In questo esercizio praticherai la segmentazione in frasi. Nel NLP, suddividere un documento nelle sue frasi è un’operazione di base molto utile. È uno dei primi passaggi in molti compiti NLP più complessi, come il riconoscimento di entità nominate. Inoltre, rilevare il numero di frasi può dare qualche indicazione sulla quantità di informazioni fornite dal testo.
Hai a disposizione dieci recensioni di cibo nell’elenco chiamato texts.
Il modello en_core_web_sm è già stato caricato come nlp e .
Questo esercizio fa parte del corso
Natural Language Processing con spaCy
Istruzioni dell'esercizio
- Esegui il modello
spaCysu ciascun elemento della listatextsper crearedocuments, un elenco di tutti i contenitoriDoc. - Estrai le frasi di ciascun contenitore
dociterando sulla listadocumentse aggiungile a una lista chiamatasentences. - Conta il numero di frasi in ciascun contenitore
docusando la listasentences.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Generating a documents list of all Doc containers
documents = [____(text) for text in texts]
# Iterate through documents and append sentences in each doc to the sentences list
sentences = []
for doc in documents:
sentences.append([s for s in ____.____])
# Find number of sentences per each doc container
print([len(____) for s in sentences])