Limpando com qdap
O pacote qdap oferece outras funções de limpeza de texto. Cada uma é útil à sua maneira e fica ainda mais poderosa quando combinada com as demais.
bracketX(): Remove todo o texto entre parênteses/colchetes (por exemplo, "It's (so) cool" vira "It's cool")replace_number(): Substitui números por seus equivalentes por extenso (por exemplo, "2" vira "two")replace_abbreviation(): Substitui abreviações por seus equivalentes por extenso (por exemplo, "Sr" vira "Senior")replace_contraction(): Expande contrações para suas formas completas (por exemplo, "shouldn't" vira "should not")replace_symbol(): Substitui símbolos comuns por suas palavras equivalentes (por exemplo, "$" vira "dollar")
Este exercício faz parte do curso
Mineração de Texto com Bag-of-Words em R
Instruções do exercício
Aplique as seguintes funções ao objeto text do exercício anterior:
bracketX()replace_number()replace_abbreviation()replace_contraction()replace_symbol()
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
## text is still loaded in your workspace
# Remove text within brackets
___
# Replace numbers with words
___
# Replace abbreviations
___
# Replace contractions
___
# Replace symbols with words
___