Comparação de dados simulados e históricos
Uma boa simulação deve apresentar resultados semelhantes aos dados históricos. Isso se aplica à simulação no vídeo? Neste exercício, você explorará uma maneira de examinar os resultados da simulação e descobrir!
Primeiro, você realizará uma simulação usando a distribuição normal multivariada e a matriz de média e covariância de dia. Em seguida, você verificará as médias dos dados históricos e simulados. Eles são semelhantes?
O conjunto de dados do diabetes foi carregado como um DataFrame, dia, e as seguintes bibliotecas foram importadas para você: pandas como pd, numpy como np, e scipy.stats como st.
Este exercício faz parte do curso
Simulações de Monte Carlo em Python
Instruções do exercício
- Faça a simulação 10.000 vezes usando a distribuição normal multivariada e a matriz de média e covariância de
dia. - Use a função
.mean()em pandas para calcular os valores médios das colunasbmietcdo conjunto de dados históricosdiae os resultados simuladosbmietcdedf_resultspara avaliar se são semelhantes. - Da mesma forma, use
.cov()do pandas para calcular a matriz de covariância das colunasbmietcdediae os resultados simulados debmietcdedf_resultspara avaliar se são semelhantes.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
cov_dia = dia[["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"]].cov()
mean_dia = dia[["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"]].mean()
# Complete the code to perform the simulation
simulation_results = st.multivariate_normal.rvs(____)
df_results = pd.DataFrame(simulation_results,columns=["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"])
# Calculate bmi and tc means for the historical and simulated results
print(dia[["bmi","tc"]].____)
print(____)
# Calculate bmi and tc covariances for the historical and simulated results
print(____)
print(____)