Explorando com boxplots
Dois formatos comuns de DataFrames são o formato wide e o formato long. No formato wide, variáveis diferentes aparecem em colunas diferentes, enquanto no formato long as variáveis são representadas por duas colunas em conjunto (uma para o nome da variável e outra para os valores correspondentes).
Versões long de DataFrames podem ser úteis para criar visualizações com facilidade, incluindo o boxplot que você vai criar neste exercício após converter df_diffs (carregado para você) do formato wide para long.
pandas já foi importado como pd, matplotlib.pyplot como plt e Seaborn como sns.
Este exercício faz parte do curso
Simulações de Monte Carlo em Python
Instruções do exercício
- Converta as colunas
bmiehdl(nessa ordem) do DataFramedf_diffsdo formato wide para o formato long; salve o DataFrame long comohdl_bmi_longe nomeie a coluna que conterá os valores das variáveis comoy_diff. - Use um boxplot para visualizar os resultados dos pacientes no primeiro ou último quartil das variáveis
hdlebmi.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Convert the hdl and bmi columns of df_diffs from wide to long format, naming the values column "y_diff"
hdl_bmi_long = df_diffs.____(value_name=____, value_vars=____)
print(hdl_bmi_long.head())
# Use a boxplot to visualize the results
____
plt.show()