Resúmenes agrupados
Así que hay más no-quejas que quejas en twitter_data. ¡Puede que empieces a cuestionarte si estos datos vienen realmente de Twitter! Hay algunas otras columnas de interés en twitter_data que conviene explorar antes de ir a los tuits en sí. Cada tuit incluye el número de seguidores que tiene ese usuario en la columna usr_followers_count. ¿Esperas que quienes se quejan tengan, de media, más o menos seguidores que quienes no se quejan? Puedes usar resúmenes agrupados para obtener una respuesta rápida y sencilla.
Este ejercicio forma parte del curso
Introducción al análisis de texto en R
Instrucciones del ejercicio
- Agrupa los datos por
complaint_label. - Calcula el número medio, mínimo y máximo de
usr_followers_count.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Start with the data frame
___ %>%
# Group the data by whether or not the tweet is a complaint
___(___) %>%
# Compute the mean, min, and max follower counts
summarize(
avg_followers = ___(___),
min_followers = ___(___),
max_followers = ___(___)
)