Cálculo de médias por categoria
Uma boa maneira de explorar ainda mais as variáveis categóricas é calcular estatísticas resumidas para cada categoria. Por exemplo, você pode calcular a média e a mediana da sua variável de resposta, agrupadas por uma variável categórica. Dessa forma, você pode comparar cada categoria com mais detalhes.
Aqui, você verá as médias agrupadas dos preços das casas no conjunto de dados de imóveis de Taiwan. Isso ajudará você a entender o resultado de uma regressão linear com uma variável categórica.
taiwan_real_estate
está disponível como um pandas
DataFrame.
Este exercício faz parte do curso
Introdução à regressão com statsmodels em Python
Instruções de exercício
- Agrupe
taiwan_real_estate
porhouse_age_years
e calcule o preço médio (price_twd_msq
) para cada faixa etária. Atribua o resultado amean_price_by_age
. - Imprima o resultado e inspecione a saída.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____
# Print the result
print(____)