ComeçarComece de graça

Carregue algum texto

A mineração de texto começa carregando dados de texto no R, o que faremos com a função read.csv().

Uma boa prática é examinar o objeto lido para garantir que você saiba quais coluna(s) são importantes. A função str() oferece uma forma eficiente de fazer isso.

Se o data frame contiver colunas que não são de texto, você pode querer criar um novo objeto usando apenas a coluna correta de texto (por exemplo, some_object$column_name).

Esteja ciente de que estes são dados reais do Twitter e, como tal, sempre existe o risco de conterem palavrões ou outro conteúdo ofensivo (neste exercício e em quaisquer exercícios seguintes que também usem dados reais do Twitter).

Este exercício faz parte do curso

Mineração de Texto com Bag-of-Words em R

Ver curso

Instruções do exercício

Os dados foram carregados para você e estão disponíveis em coffee_data_file.

  • Crie um novo objeto tweets usando read.csv() no arquivo coffee_data_file, que contém tweets mencionando café.
  • Examine o objeto tweets com str() para determinar qual coluna tem o texto que você vai analisar.
  • Crie um novo objeto coffee_tweets usando apenas a coluna de texto identificada anteriormente. Para isso, use o operador $ e o nome da coluna.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import text data from CSV, no factors
tweets <- ___

# View the structure of tweets
___

# Isolate text from tweets
coffee_tweets <- ___
Editar e executar o código