Tokenizzazione: frasi
Animal Farm è un libro molto assegnato dagli insegnanti di inglese alle scuole medie. Hai deciso di esplorare il testo e fornire statistiche riassuntive che gli insegnanti possano usare quando assegnano questo libro agli studenti. Sai già che ci sono 10 capitoli, ma sai anche che puoi usare la tokenizzazione per contare il numero di frasi, parole e persino paragrafi. In questo esercizio userai le tecniche di tokenizzazione viste nel video per dividere Animal Farm in frasi e contarle per capitolo.
Questo esercizio fa parte del corso
Introduzione all'Elaborazione del Linguaggio Naturale in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Split the text_column into sentences
animal_farm %>%
___(output = "sentences", input = text_column, token = ___)