Avaliando resultados de IMC
Qual é a diferença na progressão prevista da doença (a resposta, y) para pacientes que estão no top 10% de IMC em comparação com os 10% mais baixos de IMC? Você vai usar os resultados de uma simulação que amostra da distribuição normal multivariada para responder a essa pergunta!
A simulação já foi executada para você: sua tarefa é avaliar os resultados da simulação em df_results.
As seguintes bibliotecas já foram importadas: pandas como pd, numpy como np e scipy.stats como st.
Este exercício faz parte do curso
Simulações de Monte Carlo em Python
Instruções do exercício
- Use
np.quantile()para calcular os quantis de 10% e 90% debminos resultados simulados, salvando comobmi_q10ebmi_q90. - Use
bmi_q10ebmi_q90para filtrardf_summarye obter os valores previstos de y.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
simulation_results = st.multivariate_normal.rvs(mean=mean_dia, size=20000, cov=cov_dia)
df_results = pd.DataFrame(simulation_results,columns=["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"])
predicted_y = regr_model.predict(df_results)
df_y = pd.DataFrame(predicted_y, columns=["predicted_y"])
df_summary = pd.concat([df_results,df_y], axis=1)
# Calculate the 10th and 90th quantile of bmi in the simulated results
bmi_q10 = np.quantile(df_summary["bmi"], ____)
bmi_q90 = np.quantile(df_summary["bmi"], ____)
# Use bmi_q10 and bmi_q90 to filter df_summary and obtain predicted y values
mean_bmi_q90_outcome = np.mean(df_summary[____]["predicted_y"])
mean_bmi_q10_outcome = np.mean(df_summary[____]["predicted_y"])
y_diff = mean_bmi_q90_outcome - mean_bmi_q10_outcome
print(y_diff)