ComenzarEmpieza gratis

Cálculo de medias por categoría

Una buena forma de explorar más a fondo las variables categóricas es calcular estadísticas de resumen para cada categoría. Por ejemplo, puede calcular la media y la mediana de su variable de respuesta, agrupadas por una variable categórica. De este modo, puede comparar cada categoría con más detalle.

A continuación, se muestran las medias agrupadas de los precios de la vivienda en el conjunto de datos inmobiliarios de Taiwán. Esto le ayudará a comprender el resultado de una regresión lineal con una variable categórica.

taiwan_real_estate está disponible en pandas DataFrame.

Este ejercicio forma parte del curso

Introducción a la regresión con modelos estadísticos en Python

Ver curso

Instrucciones de ejercicio

  • Agrupe taiwan_real_estate por house_age_years y calcule el precio medio (price_twd_msq) para cada grupo de edad. Asigna el resultado a mean_price_by_age.
  • Imprima el resultado e inspeccione la salida.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____

# Print the result
print(____)
Editar y ejecutar código