ComenzarEmpieza gratis

Calcular medias por categoría

Una buena forma de profundizar en variables categóricas es calcular estadísticas resumidas para cada categoría. Por ejemplo, puedes calcular la media y la mediana de tu variable respuesta, agrupando por una variable categórica. Así podrás comparar cada categoría con más detalle.

Aquí vas a ver las medias agrupadas de los precios de vivienda del conjunto de datos de bienes raíces de Taiwán. Esto te ayudará a entender la salida de una regresión lineal con una variable categórica.

taiwan_real_estate está disponible como un DataFrame de pandas.

Este ejercicio forma parte del curso

Introducción a la regresión con statsmodels en Python

Ver curso

Instrucciones del ejercicio

  • Agrupa taiwan_real_estate por house_age_years y calcula la media del precio (price_twd_msq) para cada grupo de antigüedad. Asigna el resultado a mean_price_by_age.
  • Imprime el resultado y revisa la salida.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____

# Print the result
print(____)
Editar y ejecutar código