Erkunden mit Boxplots
Zwei gängige DataFrame-Formate sind das Wide-Format und das Long-Format. Im Wide-Format werden verschiedene Variablen in unterschiedlichen Spalten dargestellt, während im Long-Format verschiedene Variablen gemeinsam durch zwei Spalten abgebildet werden (eine für den Variablennamen und die andere für die zugehörigen Werte).
Long-Versionen von DataFrames sind hilfreich, um leicht unterschiedliche Visualisierungen zu erstellen, darunter das Boxplot, das du in dieser Übung erstellst, nachdem du df_diffs (für dich geladen) vom Wide- ins Long-Format umgewandelt hast.
pandas wurde für dich als pd geladen, matplotlib.pyplot als plt und Seaborn als sns.
Diese Übung ist Teil des Kurses
Monte-Carlo-Simulationen in Python
Anleitung zur Übung
- Wandle die Spalten
bmiundhdl(in dieser Reihenfolge) des DataFramesdf_diffsvom Wide- ins Long-Format um; speichere das Long-DataFrame alshdl_bmi_longund nenne die Spalte mit den Variablenwerteny_diff. - Verwende ein Boxplot, um die Ergebnisse von Patientinnen und Patienten im ersten oder letzten Quartil der Variablen
hdlundbmizu visualisieren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Convert the hdl and bmi columns of df_diffs from wide to long format, naming the values column "y_diff"
hdl_bmi_long = df_diffs.____(value_name=____, value_vars=____)
print(hdl_bmi_long.head())
# Use a boxplot to visualize the results
____
plt.show()