Calcular medias por categoría
Una buena forma de profundizar en variables categóricas es calcular estadísticas resumidas para cada categoría. Por ejemplo, puedes calcular la media y la mediana de tu variable respuesta, agrupando por una variable categórica. Así podrás comparar cada categoría con más detalle.
Aquí vas a ver las medias agrupadas de los precios de vivienda del conjunto de datos de bienes raíces de Taiwán. Esto te ayudará a entender la salida de una regresión lineal con una variable categórica.
taiwan_real_estate está disponible como un DataFrame de pandas.
Este ejercicio forma parte del curso
Introducción a la regresión con statsmodels en Python
Instrucciones del ejercicio
- Agrupa
taiwan_real_estateporhouse_age_yearsy calcula la media del precio (price_twd_msq) para cada grupo de antigüedad. Asigna el resultado amean_price_by_age. - Imprime el resultado y revisa la salida.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____
# Print the result
print(____)