Limpieza con qdap
El paquete qdap ofrece otras funciones para limpiar texto. Cada una es útil a su manera y resulta especialmente potente cuando se combina con las demás.
bracketX(): elimina todo el texto entre paréntesis/corchetes (p. ej., "It's (so) cool" pasa a ser "It's cool")replace_number(): sustituye números por sus equivalentes en palabras (p. ej., "2" pasa a ser "two")replace_abbreviation(): sustituye abreviaturas por su forma desarrollada (p. ej., "Sr" pasa a ser "Senior")replace_contraction(): convierte contracciones a sus palabras base (p. ej., "shouldn't" pasa a ser "should not")replace_symbol(): sustituye símbolos comunes por sus equivalentes en palabras (p. ej., "$" pasa a ser "dollar")
Este ejercicio forma parte del curso
Minería de texto con Bag-of-Words en R
Instrucciones del ejercicio
Aplica las siguientes funciones al objeto text del ejercicio anterior:
bracketX()replace_number()replace_abbreviation()replace_contraction()replace_symbol()
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
## text is still loaded in your workspace
# Remove text within brackets
___
# Replace numbers with words
___
# Replace abbreviations
___
# Replace contractions
___
# Replace symbols with words
___