ComeçarComece gratuitamente

Comparação de dados simulados e históricos

Uma boa simulação deve apresentar resultados semelhantes aos dados históricos. Isso se aplica à simulação no vídeo? Neste exercício, você explorará uma maneira de examinar os resultados da simulação e descobrir!

Primeiro, você realizará uma simulação usando a distribuição normal multivariada e a matriz de média e covariância de dia. Em seguida, você verificará as médias dos dados históricos e simulados. Eles são semelhantes?

O conjunto de dados do diabetes foi carregado como um DataFrame, dia, e as seguintes bibliotecas foram importadas para você: pandas como pd, numpy como np, e scipy.stats como st.

Este exercício faz parte do curso

Simulações de Monte Carlo em Python

Ver Curso

Instruções de exercício

  • Faça a simulação 10.000 vezes usando a distribuição normal multivariada e a matriz de média e covariância de dia.
  • Use a função .mean() em pandas para calcular os valores médios das colunas bmi e tc do conjunto de dados históricos dia e os resultados simulados bmi e tc de df_results para avaliar se são semelhantes.
  • Da mesma forma, use .cov() do pandas para calcular a matriz de covariância das colunas bmi e tc de dia e os resultados simulados de bmi e tc de df_results para avaliar se são semelhantes.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

cov_dia = dia[["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"]].cov()
mean_dia = dia[["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"]].mean()

# Complete the code to perform the simulation
simulation_results = st.multivariate_normal.rvs(____)

df_results = pd.DataFrame(simulation_results,columns=["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"])

# Calculate bmi and tc means for the historical and simulated results
print(dia[["bmi","tc"]].____)
print(____)
      
# Calculate bmi and tc covariances for the historical and simulated results
print(____)
print(____)
Editar e executar código