Criando um corpus
Você criou um tibble chamado russian_tweets que contém cerca de 20.000 tweets gerados automaticamente por bots durante o ciclo eleitoral dos EUA em 2016 para que você possa realizar análise de texto. No entanto, ao avaliar as opções disponíveis para fazer a análise que você escolheu, você acredita que o pacote tm oferece o caminho mais simples. Para conduzir a análise, primeiro é preciso criar um corpus e anexar metadados potencialmente úteis.
Fique atento: estes são dados reais do Twitter e, por isso, sempre há o risco de conterem palavrões ou outro conteúdo ofensivo (neste exercício e em quaisquer exercícios seguintes que também usem dados reais do Twitter).
Este exercício faz parte do curso
Introdução ao Processamento de Linguagem Natural em R
Instruções do exercício
- Crie um corpus usando a coluna
contentderussian_tweets. - Anexe as colunas
followingefollowerscomo metadados atweet_corpus. - Mostre as primeiras linhas da tabela de metadados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a corpus
tweet_corpus <- ___(___(russian_tweets$___))
# Attach following and followers
___(tweet_corpus, 'following') <- russian_tweets$___
___(tweet_corpus, 'followers') <- russian_tweets$___
# Review the meta data
head(meta(___))