Explorer avec des boîtes à moustaches
Deux formats courants de DataFrames sont le format large et le format long. Le format large présente différentes variables dans des colonnes distinctes, tandis que le format long représente différentes variables par l’association de deux colonnes (l’une pour le nom de la variable et l’autre pour les valeurs correspondantes).
Les versions longues de DataFrames sont utiles pour créer facilement différentes visualisations, notamment la boîte à moustaches que vous allez tracer dans cet exercice après avoir converti df_diffs (préchargé pour vous) du format large au format long.
pandas a été importé en tant que pd, matplotlib.pyplot en tant que plt, et Seaborn en tant que sns.
Cet exercice fait partie du cours
Simulations de Monte Carlo en Python
Instructions
- Convertissez les colonnes
bmiethdl(dans cet ordre) du DataFramedf_diffsdu format large au format long ; enregistrez le DataFrame long sous le nomhdl_bmi_longet nommezy_diffla colonne qui contiendra les valeurs des variables. - Utilisez une boîte à moustaches pour visualiser les résultats des patients situés dans le premier ou le dernier quartile des variables
hdletbmi.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Convert the hdl and bmi columns of df_diffs from wide to long format, naming the values column "y_diff"
hdl_bmi_long = df_diffs.____(value_name=____, value_vars=____)
print(hdl_bmi_long.head())
# Use a boxplot to visualize the results
____
plt.show()