Esplorare con i box plot
Due formati comuni dei DataFrame sono il formato wide e il formato long. Nel formato wide le diverse variabili sono rappresentate in colonne distinte, mentre nel formato long le variabili sono rappresentate da due colonne insieme (una per il nome della variabile e l'altra per i valori corrispondenti).
Le versioni long dei DataFrame sono utili per creare facilmente diverse visualizzazioni, incluso il boxplot che creerai in questo esercizio dopo aver convertito df_diffs (già caricato per te) dal formato wide al formato long.
pandas è stato caricato come pd, matplotlib.pyplot come plt e Seaborn come sns.
Questo esercizio fa parte del corso
Simulazioni Monte Carlo in Python
Istruzioni dell'esercizio
- Converti le colonne
bmiehdl(in quell'ordine) del DataFramedf_diffsdal formato wide al formato long; salva il DataFrame long comehdl_bmi_longe chiamay_diffla colonna che conterrà i valori delle variabili. - Usa un boxplot per visualizzare i risultati dei pazienti nel primo o nell'ultimo quartile delle variabili
hdlebmi.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Convert the hdl and bmi columns of df_diffs from wide to long format, naming the values column "y_diff"
hdl_bmi_long = df_diffs.____(value_name=____, value_vars=____)
print(hdl_bmi_long.head())
# Use a boxplot to visualize the results
____
plt.show()