Cálculo de medias por categoría
Una buena forma de explorar más a fondo las variables categóricas es calcular estadísticas de resumen para cada categoría. Por ejemplo, puede calcular la media y la mediana de su variable de respuesta, agrupadas por una variable categórica. De este modo, puede comparar cada categoría con más detalle.
A continuación, se muestran las medias agrupadas de los precios de la vivienda en el conjunto de datos inmobiliarios de Taiwán. Esto le ayudará a comprender el resultado de una regresión lineal con una variable categórica.
taiwan_real_estate
está disponible en pandas
DataFrame.
Este ejercicio forma parte del curso
Introducción a la regresión con modelos estadísticos en Python
Instrucciones de ejercicio
- Agrupe
taiwan_real_estate
porhouse_age_years
y calcule el precio medio (price_twd_msq
) para cada grupo de edad. Asigna el resultado amean_price_by_age
. - Imprima el resultado e inspeccione la salida.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____
# Print the result
print(____)