Porovnání simulovaných a historických dat

Dobrá simulace by měla dávat výsledky podobné historickým datům. Platilo to i pro simulaci z videa? V tomto cvičení se podíváš na jeden ze způsobů, jak výsledky simulace prozkoumat!

Nejdřív provedeš simulaci pomocí vícerozměrného normálního rozdělení s využitím průměru a kovarianční matice datasetu dia. Pak porovnáš průměry historických a simulovaných dat. Jsou si podobné?

Dataset diabetiků je načtený jako DataFrame dia a jsou pro tebe naimportovány tyto knihovny: pandas jako pd, numpy jako np a scipy.stats jako st.

Proveď simulaci 10 000krát pomocí vícerozměrného normálního rozdělení s využitím průměru a kovarianční matice datasetu dia.
Pomocí funkce .mean() z pandas vypočítej průměrné hodnoty sloupců bmi a tc v historickém datasetu dia i v simulovaných výsledcích bmi a tc z df_results a ověř, jestli jsou si podobné.
Stejným způsobem použij .cov() z pandas k výpočtu kovarianční matice sloupců bmi a tc datasetu dia i simulovaných výsledků bmi a tc z df_results a ověř jejich podobnost.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení