BMI- en HDL-uitkomsten evalueren
Wat is het verschil in de voorspelde ziekteprogressie (de respons y) voor patiënten die zowel in de hoogste 10% van BMI áls in de hoogste 25% van HDL zitten vergeleken met
patiënten die zowel in de laagste 10% van BMI als in de laagste 25% van HDL zitten? Er is opnieuw al een simulatie voor je uitgevoerd: jouw taak is om de simulatieresultaten in df_results te evalueren en het antwoord op deze vraag te vinden!
De volgende libraries zijn geïmporteerd: pandas als pd, numpy als np en scipy.stats als st.
Deze oefening maakt deel uit van de cursus
Monte Carlo-simulaties in Python
Oefeninstructies
- Maak de definities van de gemiddelde uitkomst af door de resultaten te filteren voor patiënten die zowel in de hoogste 10% van BMI als in de hoogste 25% van HDL zitten, en vervolgens voor patiënten die zowel in de laagste 10% van BMI als in de laagste 25% van HDL zitten. Gebruik hiervoor
hdl_q25,hdl_q75,bmi_q10,bmi_q90, die al voor je gedefinieerd zijn.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
simulation_results = st.multivariate_normal.rvs(mean=mean_dia, size=20000, cov=cov_dia)
df_results = pd.DataFrame(simulation_results,columns=["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"])
predicted_y = regr_model.predict(df_results)
df_y = pd.DataFrame(predicted_y, columns=["predicted_y"])
df_summary = pd.concat([df_results,df_y], axis=1)
hdl_q25 = np.quantile(df_summary["hdl"], 0.25)
hdl_q75 = np.quantile(df_summary["hdl"], 0.75)
bmi_q10 = np.quantile(df_summary["bmi"], 0.10)
bmi_q90 = np.quantile(df_summary["bmi"], 0.90)
# Complete the mean outcome definitions
bmi_q90_hdl_q75_outcome = np.mean(df_summary[(df_summary["bmi"] > bmi_q90) & (____)]____)
bmi_q10_hdl_q15_outcome = np.mean(df_summary[(df_summary["bmi"] < bmi_q10) & (____)]____)
y_diff = bmi_q90_hdl_q75_outcome - bmi_q10_hdl_q15_outcome
print(y_diff)