ComeçarComece de graça

Explorando com gráficos de caixa

Dois formatos comuns de DataFrames são o formato amplo e o formato longo. O formato amplo mostra diferentes variáveis representadas em diferentes colunas, enquanto o formato longo exibe diferentes variáveis representadas por duas colunas juntas (uma para o nome da variável e a outra para os valores correspondentes).

As versões longas dos DataFrames podem ser úteis para criar facilmente diferentes visualizações, inclusive o boxplot que você criará neste exercício depois de converter df_diffs (carregado para você) do formato largo para o longo.

O pandas foi carregado para você como pd, matplotlib.pyplot como plt e Seaborn como sns.

Este exercício faz parte do curso

Simulações de Monte Carlo em Python

Ver curso

Instruções do exercício

  • Converta as colunas bmi e hdl (especificadas nessa ordem) do DataFrame df_diffs do formato largo para o longo; salve o DataFrame longo como hdl_bmi_long e nomeie a coluna que conterá os valores da variável y_diff.
  • Use um boxplot para visualizar os resultados dos pacientes no primeiro ou no último quartil das variáveis hdl e bmi.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Convert the hdl and bmi columns of df_diffs from wide to long format, naming the values column "y_diff"
hdl_bmi_long = df_diffs.____(value_name=____, value_vars=____)
print(hdl_bmi_long.head())

# Use a boxplot to visualize the results
____
plt.show()
Editar e executar o código