Visualização de dados numéricos versus dados categóricos
Se a variável explicativa for categórica, o gráfico de dispersão que você usou antes para visualizar os dados não fará sentido. Em vez disso, uma boa opção é desenhar um histograma para cada categoria.
O conjunto de dados imobiliários de Taiwan tem uma variável categórica na forma da idade de cada casa. As idades foram divididas em três grupos: 0 a 15 anos, 15 a 30 anos e 30 a 45 anos.
taiwan_real_estate
está disponível.
Este exercício faz parte do curso
Introdução à regressão com statsmodels em Python
Instruções de exercício
- Usando
taiwan_real_estate
, trace um histograma deprice_twd_msq
com10
bins. Divida o gráfico emhouse_age_years
para obter 3 painéis.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Histograms of price_twd_msq with 10 bins, split by the age of each house
sns.____(data=____,
x=____,
____=____,
____=____)
# Show the plot
____