Membandingkan data simulasi dan data historis
Simulasi yang baik seharusnya menghasilkan keluaran yang mirip dengan data historis. Apakah itu berlaku untuk simulasi pada video? Pada latihan ini, Anda akan menjelajahi salah satu cara menelaah hasil simulasi dan mencari tahu!
Pertama, Anda akan menjalankan simulasi menggunakan sebaran normal multivariat serta nilai mean dan matriks kovarians dari dia. Lalu, Anda akan memeriksa nilai mean dari data historis dan data hasil simulasi. Apakah keduanya serupa?
Himpunan data diabetes telah dimuat sebagai DataFrame, dia, dan pustaka berikut telah diimpor untuk Anda: pandas sebagai pd, numpy sebagai np, dan scipy.stats sebagai st.
Latihan ini adalah bagian dari kursus
Simulasi Monte Carlo di Python
Petunjuk latihan
- Jalankan simulasi sebanyak 10.000 kali menggunakan sebaran normal multivariat serta nilai mean dan matriks kovarians dari
dia. - Gunakan fungsi
.mean()di pandas untuk menghitung nilai mean kolombmidantcpada himpunan data historisdiadan hasil simulasibmidantcdaridf_resultsuntuk menilai apakah keduanya serupa. - Dengan cara serupa, gunakan
.cov()dari pandas untuk menghitung matriks kovarians kolombmidantcpadadiadan hasil simulasibmidantcdaridf_resultsuntuk menilai apakah keduanya serupa.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
cov_dia = dia[["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"]].cov()
mean_dia = dia[["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"]].mean()
# Complete the code to perform the simulation
simulation_results = st.multivariate_normal.rvs(____)
df_results = pd.DataFrame(simulation_results,columns=["age", "bmi", "bp", "tc", "ldl", "hdl", "tch", "ltg", "glu"])
# Calculate bmi and tc means for the historical and simulated results
print(dia[["bmi","tc"]].____)
print(____)
# Calculate bmi and tc covariances for the historical and simulated results
print(____)
print(____)