Erkunden mit Boxplots
Zwei gängige DataFrame-Formate sind das Wide-Format und das Long-Format. Im Wide-Format werden verschiedene Variablen in unterschiedlichen Spalten dargestellt, während im Long-Format verschiedene Variablen gemeinsam durch zwei Spalten abgebildet werden (eine für den Variablennamen und die andere für die zugehörigen Werte).
Long-Versionen von DataFrames sind hilfreich, um leicht unterschiedliche Visualisierungen zu erstellen, darunter das Boxplot, das du in dieser Übung erstellst, nachdem du df_diffs (für dich geladen) vom Wide- ins Long-Format umgewandelt hast.
pandas wurde für dich als pd geladen, matplotlib.pyplot als plt und Seaborn als sns.
Diese Übung ist Teil des Kurses
<Kurs>Monte-Carlo-Simulationen in Python</Kurs>Übungsanweisungen
- Wandle die Spalten
bmiundhdl(in dieser Reihenfolge) des DataFramesdf_diffsvom Wide- ins Long-Format um; speichere das Long-DataFrame alshdl_bmi_longund nenne die Spalte mit den Variablenwerteny_diff. - Verwende ein Boxplot, um die Ergebnisse von Patientinnen und Patienten im ersten oder letzten Quartil der Variablen
hdlundbmizu visualisieren.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Convert the hdl and bmi columns of df_diffs from wide to long format, naming the values column "y_diff"
hdl_bmi_long = df_diffs.____(value_name=____, value_vars=____)
print(hdl_bmi_long.head())
# Use a boxplot to visualize the results
____
plt.show()