Cálculo de médias por categoria
Uma boa maneira de explorar ainda mais as variáveis categóricas é calcular estatísticas resumidas para cada categoria. Por exemplo, você pode calcular a média e a mediana da sua variável de resposta, agrupadas por uma variável categórica. Dessa forma, você pode comparar cada categoria com mais detalhes.
Aqui, você verá as médias agrupadas dos preços das casas no conjunto de dados de imóveis de Taiwan. Isso ajudará você a entender o resultado de uma regressão linear com uma variável categórica.
taiwan_real_estate está disponível como um pandas DataFrame.
Este exercicio faz parte do curso
Introdução à Regressão com statsmodels em Python
Instruções do exercicio
- Agrupe
taiwan_real_estateporhouse_age_yearse calcule o preço médio (price_twd_msq) para cada faixa etária. Atribua o resultado amean_price_by_age. - Imprima o resultado e inspecione a saída.
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____
# Print the result
print(____)