CommencerCommencer gratuitement

Explorer avec des boîtes à moustaches

Deux formats courants de DataFrames sont le format large et le format long. Le format large présente différentes variables dans des colonnes distinctes, tandis que le format long représente différentes variables par l’association de deux colonnes (l’une pour le nom de la variable et l’autre pour les valeurs correspondantes).

Les versions longues de DataFrames sont utiles pour créer facilement différentes visualisations, notamment la boîte à moustaches que vous allez tracer dans cet exercice après avoir converti df_diffs (préchargé pour vous) du format large au format long.

pandas a été importé en tant que pd, matplotlib.pyplot en tant que plt, et Seaborn en tant que sns.

Cet exercice fait partie du cours

Simulations de Monte Carlo en Python

Afficher le cours

Instructions

  • Convertissez les colonnes bmi et hdl (dans cet ordre) du DataFrame df_diffs du format large au format long ; enregistrez le DataFrame long sous le nom hdl_bmi_long et nommez y_diff la colonne qui contiendra les valeurs des variables.
  • Utilisez une boîte à moustaches pour visualiser les résultats des patients situés dans le premier ou le dernier quartile des variables hdl et bmi.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Convert the hdl and bmi columns of df_diffs from wide to long format, naming the values column "y_diff"
hdl_bmi_long = df_diffs.____(value_name=____, value_vars=____)
print(hdl_bmi_long.head())

# Use a boxplot to visualize the results
____
plt.show()
Modifier et exécuter le code