1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Monte Carlo simulace v Pythonu

Connected

cvičení

Porovnání simulovaných a historických dat

Dobrá simulace by měla dávat výsledky podobné historickým datům. Platilo to i pro simulaci z videa? V tomto cvičení se podíváš na jeden ze způsobů, jak výsledky simulace prozkoumat!

Nejdřív provedeš simulaci pomocí vícerozměrného normálního rozdělení s využitím průměru a kovarianční matice datasetu dia. Pak porovnáš průměry historických a simulovaných dat. Jsou si podobné?

Dataset diabetiků je načtený jako DataFrame dia a jsou pro tebe naimportovány tyto knihovny: pandas jako pd, numpy jako np a scipy.stats jako st.

Pokyny

100 XP
  • Proveď simulaci 10 000krát pomocí vícerozměrného normálního rozdělení s využitím průměru a kovarianční matice datasetu dia.
  • Pomocí funkce .mean() z pandas vypočítej průměrné hodnoty sloupců bmi a tc v historickém datasetu dia i v simulovaných výsledcích bmi a tc z df_results a ověř, jestli jsou si podobné.
  • Stejným způsobem použij .cov() z pandas k výpočtu kovarianční matice sloupců bmi a tc datasetu dia i simulovaných výsledků bmi a tc z df_results a ověř jejich podobnost.