ComeçarComece de graça

Criando um corpus

Você criou um tibble chamado russian_tweets que contém cerca de 20.000 tweets gerados automaticamente por bots durante o ciclo eleitoral dos EUA em 2016 para que você possa realizar análise de texto. No entanto, ao avaliar as opções disponíveis para fazer a análise que você escolheu, você acredita que o pacote tm oferece o caminho mais simples. Para conduzir a análise, primeiro é preciso criar um corpus e anexar metadados potencialmente úteis.

Fique atento: estes são dados reais do Twitter e, por isso, sempre há o risco de conterem palavrões ou outro conteúdo ofensivo (neste exercício e em quaisquer exercícios seguintes que também usem dados reais do Twitter).

Este exercício faz parte do curso

Introdução ao Processamento de Linguagem Natural em R

Ver curso

Instruções do exercício

  • Crie um corpus usando a coluna content de russian_tweets.
  • Anexe as colunas following e followers como metadados a tweet_corpus.
  • Mostre as primeiras linhas da tabela de metadados.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a corpus
tweet_corpus <- ___(___(russian_tweets$___))

# Attach following and followers
___(tweet_corpus, 'following') <- russian_tweets$___
___(tweet_corpus, 'followers') <- russian_tweets$___

# Review the meta data
head(meta(___))
Editar e executar o código