Mengevaluasi luaran BMI
Apa perbedaan prediksi progresi penyakit (respon, y) untuk pasien yang berada pada 10% teratas BMI dibandingkan dengan 10% terbawah BMI? Anda akan menggunakan hasil simulasi yang melakukan sampling dari sebaran normal multivariat untuk menjawab pertanyaan ini!
Simulasi sudah dijalankan untuk Anda: tugas Anda adalah mengevaluasi hasil simulasi di df_results.
Pustaka berikut telah diimpor untuk Anda: pandas sebagai pd, numpy sebagai np, dan scipy.stats sebagai st.
Latihan ini adalah bagian dari kursus
Simulasi Monte Carlo di Python
Petunjuk latihan
- Gunakan
np.quantile()untuk menghitung kuantil ke-10 dan ke-90 daribmipada hasil simulasi, lalu simpan sebagaibmi_q10danbmi_q90. - Gunakan
bmi_q10danbmi_q90untuk memfilterdf_summarydan memperoleh nilai y terprediksi.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
simulation_results = st.multivariate_normal.rvs(mean=mean_dia, size=20000, cov=cov_dia)
df_results = pd.DataFrame(simulation_results,columns=["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"])
predicted_y = regr_model.predict(df_results)
df_y = pd.DataFrame(predicted_y, columns=["predicted_y"])
df_summary = pd.concat([df_results,df_y], axis=1)
# Calculate the 10th and 90th quantile of bmi in the simulated results
bmi_q10 = np.quantile(df_summary["bmi"], ____)
bmi_q90 = np.quantile(df_summary["bmi"], ____)
# Use bmi_q10 and bmi_q90 to filter df_summary and obtain predicted y values
mean_bmi_q90_outcome = np.mean(df_summary[____]["predicted_y"])
mean_bmi_q10_outcome = np.mean(df_summary[____]["predicted_y"])
y_diff = mean_bmi_q90_outcome - mean_bmi_q10_outcome
print(y_diff)