Eksplorasi dengan box plot
Dua format umum DataFrame adalah format lebar (wide) dan format panjang (long). Format lebar menampilkan variabel yang berbeda pada kolom yang berbeda, sedangkan format panjang menampilkan variabel yang berbeda melalui dua kolom sekaligus (satu untuk nama variabel dan satu lagi untuk nilai yang bersesuaian).
Versi panjang dari DataFrame dapat berguna untuk dengan mudah membuat berbagai visualisasi, termasuk boxplot yang akan Anda buat dalam latihan ini setelah mengonversi df_diffs (sudah dimuat) dari format lebar ke format panjang.
pandas telah dimuat sebagai pd, matplotlib.pyplot sebagai plt, dan Seaborn sebagai sns.
Latihan ini adalah bagian dari kursus
Simulasi Monte Carlo di Python
Petunjuk latihan
- Konversi kolom
bmidanhdl(ditentukan dalam urutan tersebut) dari DataFramedf_diffsdari format lebar ke format panjang; simpan DataFrame panjang sebagaihdl_bmi_longdan beri nama kolom yang akan berisi nilai variabely_diff. - Gunakan boxplot untuk memvisualisasikan hasil pasien pada kuartil pertama atau terakhir dari variabel
hdldanbmi.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Convert the hdl and bmi columns of df_diffs from wide to long format, naming the values column "y_diff"
hdl_bmi_long = df_diffs.____(value_name=____, value_vars=____)
print(hdl_bmi_long.head())
# Use a boxplot to visualize the results
____
plt.show()