Datos de tuits sobre aerolíneas
El data frame twitter_data contiene más de 7.000 tuits sobre aerolíneas. Los tuits ya se han clasificado como quejas o no quejas en la columna complaint_label. Vamos a hacernos una idea de cuántos de estos tuits son quejas.
Ten en cuenta que son datos reales de Twitter y, por tanto, existe el riesgo de que contengan lenguaje soez u otro contenido ofensivo (en este ejercicio y en cualquier ejercicio posterior que también use datos reales de Twitter).
Este ejercicio forma parte del curso
Introducción al análisis de texto en R
Instrucciones del ejercicio
- Carga el paquete
tidyverse. - Echa un vistazo al tamaño y al contenido de los datos imprimiendo
twitter_data. - Filtra
twitter_datapara que contenga solo las quejas. ¿Cuántas quejas hay en los datos?
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load the tidyverse packages
___(___)
# Print twitter_data
___
# Print just the complaints in twitter_data
twitter_data %>%
___(___ == ___)