IniziaInizia gratis

Esplorare con i box plot

Due formati comuni dei DataFrame sono il formato wide e il formato long. Nel formato wide le diverse variabili sono rappresentate in colonne distinte, mentre nel formato long le variabili sono rappresentate da due colonne insieme (una per il nome della variabile e l'altra per i valori corrispondenti).

Le versioni long dei DataFrame sono utili per creare facilmente diverse visualizzazioni, incluso il boxplot che creerai in questo esercizio dopo aver convertito df_diffs (già caricato per te) dal formato wide al formato long.

pandas è stato caricato come pd, matplotlib.pyplot come plt e Seaborn come sns.

Questo esercizio fa parte del corso

Simulazioni Monte Carlo in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Converti le colonne bmi e hdl (in quell'ordine) del DataFrame df_diffs dal formato wide al formato long; salva il DataFrame long come hdl_bmi_long e chiama y_diff la colonna che conterrà i valori delle variabili.
  • Usa un boxplot per visualizzare i risultati dei pazienti nel primo o nell'ultimo quartile delle variabili hdl e bmi.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Convert the hdl and bmi columns of df_diffs from wide to long format, naming the values column "y_diff"
hdl_bmi_long = df_diffs.____(value_name=____, value_vars=____)
print(hdl_bmi_long.head())

# Use a boxplot to visualize the results
____
plt.show()
Modifica ed esegui il codice