Ejemplo de similitud del coseno
El argumento de Animal Farm es bastante sencillo. Al principio, los animales están descontentos con seguir a sus líderes humanos. En la parte central los derrocan y, al final, vuelven a estar descontentos con los animales que acaban convirtiéndose en sus nuevos líderes.
Si se aplica correctamente, la similitud del coseno puede ayudar a identificar documentos (capítulos) que se parecen entre sí. En este ejercicio, vas a identificar capítulos similares en Animal Farm. Es probable que el capítulo 1 (el inicio) y el capítulo 10 (el final) sean similares.
Este ejercicio forma parte del curso
Introducción al procesamiento del lenguaje natural en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create word counts
animal_farm_counts <- animal_farm %>%
unnest_tokens(word, text_column) %>%
___(___) %>%
count(chapter, word)