or
Este ejercicio forma parte del curso
Como el texto es un dato no estructurado, hay que hacer cierta manipulación para llevarlo a un formato que puedas analizar. En este capítulo, aprenderás a añadir estructura al texto mediante la tokenización, la limpieza y el tratamiento del texto como dato categórico.
Aunque los conteos están bien, las visualizaciones son mejores. En este capítulo, aprenderás a aplicar lo que ya conoces de ggplot2 a datos de texto en formato tidy.
Aunque los conteos de palabras y las visualizaciones sugieren algo sobre el contenido, podemos ir más allá. En este capítulo, vamos más allá de los conteos de palabras para analizar el sentimiento o la valencia emocional del texto.
En este capítulo final, vamos más allá de los conteos de palabras para descubrir los temas subyacentes en una colección de documentos. Usaremos un modelo de temas estándar conocido como asignación latente de Dirichlet (LDA).
Ejercicio actual