ComeçarComece gratuitamente

Cálculo de médias por categoria

Uma boa maneira de explorar ainda mais as variáveis categóricas é calcular estatísticas resumidas para cada categoria. Por exemplo, você pode calcular a média e a mediana da sua variável de resposta, agrupadas por uma variável categórica. Dessa forma, você pode comparar cada categoria com mais detalhes.

Aqui, você verá as médias agrupadas dos preços das casas no conjunto de dados de imóveis de Taiwan. Isso ajudará você a entender o resultado de uma regressão linear com uma variável categórica.

taiwan_real_estate está disponível como um pandas DataFrame.

Este exercício faz parte do curso

Introdução à regressão com statsmodels em Python

Ver Curso

Instruções de exercício

  • Agrupe taiwan_real_estate por house_age_years e calcule o preço médio (price_twd_msq) para cada faixa etária. Atribua o resultado a mean_price_by_age.
  • Imprima o resultado e inspecione a saída.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Calculate the mean of price_twd_msq, grouped by house age
mean_price_by_age = ____.____(____)[____].____

# Print the result
print(____)
Editar e executar código