ComenzarEmpieza gratis

Limpieza con qdap

El paquete qdap ofrece otras funciones para limpiar texto. Cada una es útil a su manera y resulta especialmente potente cuando se combina con las demás.

  • bracketX(): elimina todo el texto entre paréntesis/corchetes (p. ej., "It's (so) cool" pasa a ser "It's cool")
  • replace_number(): sustituye números por sus equivalentes en palabras (p. ej., "2" pasa a ser "two")
  • replace_abbreviation(): sustituye abreviaturas por su forma desarrollada (p. ej., "Sr" pasa a ser "Senior")
  • replace_contraction(): convierte contracciones a sus palabras base (p. ej., "shouldn't" pasa a ser "should not")
  • replace_symbol(): sustituye símbolos comunes por sus equivalentes en palabras (p. ej., "$" pasa a ser "dollar")

Este ejercicio forma parte del curso

Minería de texto con Bag-of-Words en R

Ver curso

Instrucciones del ejercicio

Aplica las siguientes funciones al objeto text del ejercicio anterior:

  • bracketX()
  • replace_number()
  • replace_abbreviation()
  • replace_contraction()
  • replace_symbol()

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

## text is still loaded in your workspace

# Remove text within brackets
___

# Replace numbers with words
___

# Replace abbreviations
___

# Replace contractions
___

# Replace symbols with words
___
Editar y ejecutar código