Remover URLs e caracteres que não sejam letras
O texto de tweets publicados por usuários do Twitter é não estruturado, ruidoso e bruto.
Ele contém emoticons, URLs e números. Essas informações redundantes precisam ser limpas antes da análise para gerar resultados confiáveis.
Neste exercício, você vai remover URLs e substituir caracteres que não sejam letras por espaços.
O data frame de tweets twt_telmed, com 1000 tweets extraídos sobre "telemedicine", já foi pré-carregado para este exercício.
A biblioteca qdapRegex já foi pré-carregada para este exercício.
Este exercício faz parte do curso
Analisando dados de mídias sociais em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Extract tweet text from the pre-loaded dataset
twt_txt <- ___$___
head(twt_txt)