Eksplorasi dengan box plot
Dua format umum DataFrame adalah format lebar (wide) dan format panjang (long). Format lebar menampilkan variabel yang berbeda pada kolom yang berbeda, sedangkan format panjang menampilkan variabel yang berbeda melalui dua kolom sekaligus (satu untuk nama variabel dan satu lagi untuk nilai yang bersesuaian).
Versi panjang dari DataFrame dapat berguna untuk dengan mudah membuat berbagai visualisasi, termasuk boxplot yang akan Anda buat dalam latihan ini setelah mengonversi df_diffs (sudah dimuat) dari format lebar ke format panjang.
pandas telah dimuat sebagai pd, matplotlib.pyplot sebagai plt, dan Seaborn sebagai sns.
Latihan ini merupakan bagian dari kursus
Simulasi Monte Carlo di Python
Instruksi latihan
- Konversi kolom
bmidanhdl(ditentukan dalam urutan tersebut) dari DataFramedf_diffsdari format lebar ke format panjang; simpan DataFrame panjang sebagaihdl_bmi_longdan beri nama kolom yang akan berisi nilai variabely_diff. - Gunakan boxplot untuk memvisualisasikan hasil pasien pada kuartil pertama atau terakhir dari variabel
hdldanbmi.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Convert the hdl and bmi columns of df_diffs from wide to long format, naming the values column "y_diff"
hdl_bmi_long = df_diffs.____(value_name=____, value_vars=____)
print(hdl_bmi_long.head())
# Use a boxplot to visualize the results
____
plt.show()