IniziaInizia gratis

Tokenizzazione: frasi

Animal Farm è un libro molto assegnato dagli insegnanti di inglese alle scuole medie. Hai deciso di esplorare il testo e fornire statistiche riassuntive che gli insegnanti possano usare quando assegnano questo libro agli studenti. Sai già che ci sono 10 capitoli, ma sai anche che puoi usare la tokenizzazione per contare il numero di frasi, parole e persino paragrafi. In questo esercizio userai le tecniche di tokenizzazione viste nel video per dividere Animal Farm in frasi e contarle per capitolo.

Questo esercizio fa parte del corso

Introduzione all'Elaborazione del Linguaggio Naturale in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Split the text_column into sentences
animal_farm %>%
  ___(output = "sentences", input = text_column, token = ___)
Modifica ed esegui il codice