ComeçarComece de graça

Limpando com qdap

O pacote qdap oferece outras funções de limpeza de texto. Cada uma é útil à sua maneira e fica ainda mais poderosa quando combinada com as demais.

  • bracketX(): Remove todo o texto entre parênteses/colchetes (por exemplo, "It's (so) cool" vira "It's cool")
  • replace_number(): Substitui números por seus equivalentes por extenso (por exemplo, "2" vira "two")
  • replace_abbreviation(): Substitui abreviações por seus equivalentes por extenso (por exemplo, "Sr" vira "Senior")
  • replace_contraction(): Expande contrações para suas formas completas (por exemplo, "shouldn't" vira "should not")
  • replace_symbol(): Substitui símbolos comuns por suas palavras equivalentes (por exemplo, "$" vira "dollar")

Este exercício faz parte do curso

Mineração de Texto com Bag-of-Words em R

Ver curso

Instruções do exercício

Aplique as seguintes funções ao objeto text do exercício anterior:

  • bracketX()
  • replace_number()
  • replace_abbreviation()
  • replace_contraction()
  • replace_symbol()

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

## text is still loaded in your workspace

# Remove text within brackets
___

# Replace numbers with words
___

# Replace abbreviations
___

# Replace contractions
___

# Replace symbols with words
___
Editar e executar o código