BMI- en HDL-uitkomsten evalueren

Wat is het verschil in de voorspelde ziekteprogressie (de respons y) voor patiënten die zowel in de hoogste 10% van BMI áls in de hoogste 25% van HDL zitten vergeleken met patiënten die zowel in de laagste 10% van BMI als in de laagste 25% van HDL zitten? Er is opnieuw al een simulatie voor je uitgevoerd: jouw taak is om de simulatieresultaten in df_results te evalueren en het antwoord op deze vraag te vinden!

De volgende libraries zijn geïmporteerd: pandas als pd, numpy als np en scipy.stats als st.

Deze oefening maakt deel uit van de cursus

Monte Carlo-simulaties in Python

Bekijk cursus

Oefeninstructies

Maak de definities van de gemiddelde uitkomst af door de resultaten te filteren voor patiënten die zowel in de hoogste 10% van BMI als in de hoogste 25% van HDL zitten, en vervolgens voor patiënten die zowel in de laagste 10% van BMI als in de laagste 25% van HDL zitten. Gebruik hiervoor hdl_q25, hdl_q75, bmi_q10, bmi_q90, die al voor je gedefinieerd zijn.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

simulation_results = st.multivariate_normal.rvs(mean=mean_dia, size=20000, cov=cov_dia)
df_results = pd.DataFrame(simulation_results,columns=["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"])
predicted_y = regr_model.predict(df_results)
df_y = pd.DataFrame(predicted_y, columns=["predicted_y"])
df_summary = pd.concat([df_results,df_y], axis=1)
hdl_q25 = np.quantile(df_summary["hdl"], 0.25)
hdl_q75 = np.quantile(df_summary["hdl"], 0.75)
bmi_q10 = np.quantile(df_summary["bmi"], 0.10)
bmi_q90 = np.quantile(df_summary["bmi"], 0.90)

# Complete the mean outcome definitions
bmi_q90_hdl_q75_outcome = np.mean(df_summary[(df_summary["bmi"] > bmi_q90) & (____)]____) 
bmi_q10_hdl_q15_outcome = np.mean(df_summary[(df_summary["bmi"] < bmi_q10) & (____)]____) 
y_diff = bmi_q90_hdl_q75_outcome - bmi_q10_hdl_q15_outcome
print(y_diff)

Code bewerken en uitvoeren