IniziaInizia gratis

Pulizia con qdap

Il pacchetto qdap offre altre funzioni per la pulizia del testo. Ognuna è utile a modo suo ed è particolarmente potente se combinata con le altre.

  • bracketX(): rimuove tutto il testo tra parentesi (ad es. "It's (so) cool" diventa "It's cool")
  • replace_number(): sostituisce i numeri con il loro equivalente in parole (ad es. "2" diventa "two")
  • replace_abbreviation(): sostituisce le abbreviazioni con il testo per esteso (ad es. "Sr" diventa "Senior")
  • replace_contraction(): espande le forme contratte nelle parole base (ad es. "shouldn't" diventa "should not")
  • replace_symbol(): sostituisce i simboli comuni con il loro equivalente in parole (ad es. "$" diventa "dollar")

Questo esercizio fa parte del corso

Text mining con Bag-of-Words in R

Visualizza il corso

Istruzioni dell'esercizio

Applica le seguenti funzioni all'oggetto text dell'esercizio precedente:

  • bracketX()
  • replace_number()
  • replace_abbreviation()
  • replace_contraction()
  • replace_symbol()

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

## text is still loaded in your workspace

# Remove text within brackets
___

# Replace numbers with words
___

# Replace abbreviations
___

# Replace contractions
___

# Replace symbols with words
___
Modifica ed esegui il codice