Comparação de dados simulados e históricos
Uma boa simulação deve apresentar resultados semelhantes aos dados históricos. Isso se aplica à simulação no vídeo? Neste exercício, você explorará uma maneira de examinar os resultados da simulação e descobrir!
Primeiro, você realizará uma simulação usando a distribuição normal multivariada e a matriz de média e covariância de dia
. Em seguida, você verificará as médias dos dados históricos e simulados. Eles são semelhantes?
O conjunto de dados do diabetes foi carregado como um DataFrame, dia
, e as seguintes bibliotecas foram importadas para você: pandas
como pd
, numpy
como np
, e scipy.stats
como st
.
Este exercício faz parte do curso
Simulações de Monte Carlo em Python
Instruções de exercício
- Faça a simulação 10.000 vezes usando a distribuição normal multivariada e a matriz de média e covariância de
dia
. - Use a função
.mean()
em pandas para calcular os valores médios das colunasbmi
etc
do conjunto de dados históricosdia
e os resultados simuladosbmi
etc
dedf_results
para avaliar se são semelhantes. - Da mesma forma, use
.cov()
do pandas para calcular a matriz de covariância das colunasbmi
etc
dedia
e os resultados simulados debmi
etc
dedf_results
para avaliar se são semelhantes.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
cov_dia = dia[["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"]].cov()
mean_dia = dia[["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"]].mean()
# Complete the code to perform the simulation
simulation_results = st.multivariate_normal.rvs(____)
df_results = pd.DataFrame(simulation_results,columns=["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"])
# Calculate bmi and tc means for the historical and simulated results
print(dia[["bmi","tc"]].____)
print(____)
# Calculate bmi and tc covariances for the historical and simulated results
print(____)
print(____)