Évaluer les résultats IMC et HDL
Quelle est la différence de progression prédite de la maladie (la réponse y) entre les patients qui sont à la fois dans les 10 % les plus élevés d’IMC et dans les 25 % les plus élevés de HDL, et ceux qui sont à la fois dans les 10 % les plus faibles d’IMC et dans les 25 % les plus faibles de HDL ? Là encore, une simulation a déjà été réalisée pour vous : votre tâche est d’évaluer les résultats de la simulation dans df_results pour répondre à cette question !
Les bibliothèques suivantes ont été importées : pandas sous le nom pd, numpy sous le nom np, et scipy.stats sous le nom st.
Cet exercice fait partie du cours
Simulations de Monte Carlo en Python
Instructions
- Complétez les définitions des moyennes des résultats en filtrant d’abord les patients qui sont à la fois dans les 10 % les plus élevés d’IMC et dans les 25 % les plus élevés de HDL, puis ceux qui sont à la fois dans les 10 % les plus faibles d’IMC et dans les 25 % les plus faibles de HDL, en utilisant
hdl_q25,hdl_q75,bmi_q10,bmi_q90, qui sont déjà définis pour vous.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
simulation_results = st.multivariate_normal.rvs(mean=mean_dia, size=20000, cov=cov_dia)
df_results = pd.DataFrame(simulation_results,columns=["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"])
predicted_y = regr_model.predict(df_results)
df_y = pd.DataFrame(predicted_y, columns=["predicted_y"])
df_summary = pd.concat([df_results,df_y], axis=1)
hdl_q25 = np.quantile(df_summary["hdl"], 0.25)
hdl_q75 = np.quantile(df_summary["hdl"], 0.75)
bmi_q10 = np.quantile(df_summary["bmi"], 0.10)
bmi_q90 = np.quantile(df_summary["bmi"], 0.90)
# Complete the mean outcome definitions
bmi_q90_hdl_q75_outcome = np.mean(df_summary[(df_summary["bmi"] > bmi_q90) & (____)]____)
bmi_q10_hdl_q15_outcome = np.mean(df_summary[(df_summary["bmi"] < bmi_q10) & (____)]____)
y_diff = bmi_q90_hdl_q75_outcome - bmi_q10_hdl_q15_outcome
print(y_diff)