Pulizia con qdap
Il pacchetto qdap offre altre funzioni per la pulizia del testo. Ognuna è utile a modo suo ed è particolarmente potente se combinata con le altre.
bracketX(): rimuove tutto il testo tra parentesi (ad es. "It's (so) cool" diventa "It's cool")replace_number(): sostituisce i numeri con il loro equivalente in parole (ad es. "2" diventa "two")replace_abbreviation(): sostituisce le abbreviazioni con il testo per esteso (ad es. "Sr" diventa "Senior")replace_contraction(): espande le forme contratte nelle parole base (ad es. "shouldn't" diventa "should not")replace_symbol(): sostituisce i simboli comuni con il loro equivalente in parole (ad es. "$" diventa "dollar")
Questo esercizio fa parte del corso
Text mining con Bag-of-Words in R
Istruzioni dell'esercizio
Applica le seguenti funzioni all'oggetto text dell'esercizio precedente:
bracketX()replace_number()replace_abbreviation()replace_contraction()replace_symbol()
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
## text is still loaded in your workspace
# Remove text within brackets
___
# Replace numbers with words
___
# Replace abbreviations
___
# Replace contractions
___
# Replace symbols with words
___