ComeçarComece de graça

Exemplo de similaridade cosseno

O enredo de Animal Farm é bem simples. No começo, os animais estão insatisfeitos por seguir seus líderes humanos. No meio, eles derrubam esses líderes e, no final, ficam insatisfeitos com os próprios animais que acabam se tornando seus novos líderes.

Quando aplicada corretamente, a similaridade cosseno pode ajudar a identificar documentos (capítulos) que são parecidos entre si. Neste exercício, você vai identificar capítulos semelhantes em Animal Farm. As chances são de que o capítulo 1 (o começo) e o capítulo 10 (o final) sejam semelhantes.

Este exercício faz parte do curso

Introdução ao Processamento de Linguagem Natural em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create word counts 
animal_farm_counts <- animal_farm %>%
  unnest_tokens(word, text_column) %>%
  ___(___) %>%
  count(chapter, word)
Editar e executar o código