Exemplo de similaridade cosseno
O enredo de Animal Farm é bem simples. No começo, os animais estão insatisfeitos por seguir seus líderes humanos. No meio, eles derrubam esses líderes e, no final, ficam insatisfeitos com os próprios animais que acabam se tornando seus novos líderes.
Quando aplicada corretamente, a similaridade cosseno pode ajudar a identificar documentos (capítulos) que são parecidos entre si. Neste exercício, você vai identificar capítulos semelhantes em Animal Farm. As chances são de que o capítulo 1 (o começo) e o capítulo 10 (o final) sejam semelhantes.
Este exercício faz parte do curso
Introdução ao Processamento de Linguagem Natural em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create word counts
animal_farm_counts <- animal_farm %>%
unnest_tokens(word, text_column) %>%
___(___) %>%
count(chapter, word)