Criando uma DTM
Crie uma matriz termo-documento (DTM) usando os dados tidy_twitter. Neste caso, cada tweet é considerado um documento. Imprima tidy_twitter no console para confirmar os nomes das colunas.
Este exercício faz parte do curso
Introdução à Análise de Texto em R
Instruções do exercício
- Comece com os dados do Twitter já organizados.
- Conte cada palavra usada em cada tweet.
- Use as contagens de palavras por tweet para criar uma DTM.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Start with the tidied Twitter data
___ %>%
# Count each word used in each tweet
___(word, ___) %>%
# Use the word counts by tweet to create a DTM
cast_dtm(___, word, n)