Carregue algum texto
A mineração de texto começa carregando dados de texto no R, o que faremos com a função read.csv().
Uma boa prática é examinar o objeto lido para garantir que você saiba quais coluna(s) são importantes. A função str() oferece uma forma eficiente de fazer isso.
Se o data frame contiver colunas que não são de texto, você pode querer criar um novo objeto usando apenas a coluna correta de texto (por exemplo, some_object$column_name).
Esteja ciente de que estes são dados reais do Twitter e, como tal, sempre existe o risco de conterem palavrões ou outro conteúdo ofensivo (neste exercício e em quaisquer exercícios seguintes que também usem dados reais do Twitter).
Este exercício faz parte do curso
Mineração de Texto com Bag-of-Words em R
Instruções do exercício
Os dados foram carregados para você e estão disponíveis em coffee_data_file.
- Crie um novo objeto
tweetsusandoread.csv()no arquivocoffee_data_file, que contém tweets mencionando café. - Examine o objeto
tweetscomstr()para determinar qual coluna tem o texto que você vai analisar. - Crie um novo objeto
coffee_tweetsusando apenas a coluna de texto identificada anteriormente. Para isso, use o operador$e o nome da coluna.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import text data from CSV, no factors
tweets <- ___
# View the structure of tweets
___
# Isolate text from tweets
coffee_tweets <- ___