ComeçarComece de graça

Remover URLs e caracteres que não sejam letras

O texto de tweets publicados por usuários do Twitter é não estruturado, ruidoso e bruto.

Ele contém emoticons, URLs e números. Essas informações redundantes precisam ser limpas antes da análise para gerar resultados confiáveis.

Neste exercício, você vai remover URLs e substituir caracteres que não sejam letras por espaços.

O data frame de tweets twt_telmed, com 1000 tweets extraídos sobre "telemedicine", já foi pré-carregado para este exercício.

A biblioteca qdapRegex já foi pré-carregada para este exercício.

Este exercício faz parte do curso

Analisando dados de mídias sociais em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Extract tweet text from the pre-loaded dataset
twt_txt <- ___$___
head(twt_txt)
Editar e executar o código