Explorando com gráficos de caixa
Dois formatos comuns de DataFrames são o formato amplo e o formato longo. O formato amplo mostra diferentes variáveis representadas em diferentes colunas, enquanto o formato longo exibe diferentes variáveis representadas por duas colunas juntas (uma para o nome da variável e a outra para os valores correspondentes).
As versões longas dos DataFrames podem ser úteis para criar facilmente diferentes visualizações, inclusive o boxplot que você criará neste exercício depois de converter df_diffs
(carregado para você) do formato largo para o longo.
O pandas foi carregado para você como pd
, matplotlib.pyplot
como plt
e Seaborn como sns
.
Este exercício faz parte do curso
Simulações de Monte Carlo em Python
Instruções do exercício
- Converta as colunas
bmi
ehdl
(especificadas nessa ordem) do DataFramedf_diffs
do formato largo para o longo; salve o DataFrame longo comohdl_bmi_long
e nomeie a coluna que conterá os valores da variávely_diff
. - Use um boxplot para visualizar os resultados dos pacientes no primeiro ou no último quartil das variáveis
hdl
ebmi
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Convert the hdl and bmi columns of df_diffs from wide to long format, naming the values column "y_diff"
hdl_bmi_long = df_diffs.____(value_name=____, value_vars=____)
print(hdl_bmi_long.head())
# Use a boxplot to visualize the results
____
plt.show()