ComenzarEmpieza gratis

Ejemplo de similitud del coseno

El argumento de Animal Farm es bastante sencillo. Al principio, los animales están descontentos con seguir a sus líderes humanos. En la parte central los derrocan y, al final, vuelven a estar descontentos con los animales que acaban convirtiéndose en sus nuevos líderes.

Si se aplica correctamente, la similitud del coseno puede ayudar a identificar documentos (capítulos) que se parecen entre sí. En este ejercicio, vas a identificar capítulos similares en Animal Farm. Es probable que el capítulo 1 (el inicio) y el capítulo 10 (el final) sean similares.

Este ejercicio forma parte del curso

Introducción al procesamiento del lenguaje natural en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create word counts 
animal_farm_counts <- animal_farm %>%
  unnest_tokens(word, text_column) %>%
  ___(___) %>%
  count(chapter, word)
Editar y ejecutar código