Porównanie danych symulowanych z historycznymi

Dobra symulacja powinna dawać wyniki zbliżone do danych historycznych. Czy tak było w przypadku symulacji z filmu? W tym ćwiczeniu sprawdzisz jeden ze sposobów oceny wyników symulacji!

Najpierw przeprowadzisz symulację z wykorzystaniem wielowymiarowego rozkładu normalnego oraz średniej i macierzy kowariancji zbioru dia. Następnie porównasz średnie wartości danych historycznych i symulowanych. Czy są do siebie podobne?

Zbiór danych dotyczący cukrzycy został wczytany jako DataFrame dia. Zaimportowano dla ciebie następujące biblioteki: pandas jako pd, numpy jako np oraz scipy.stats jako st.

Przeprowadź symulację 10 000 razy, korzystając z wielowymiarowego rozkładu normalnego oraz średniej i macierzy kowariancji zbioru dia.
Użyj funkcji .mean() z biblioteki pandas, aby obliczyć średnie wartości kolumn bmi i tc w historycznym zbiorze danych dia oraz w symulowanych wynikach z df_results – sprawdź, czy są do siebie podobne.
Podobnie, użyj .cov() z pandas, aby obliczyć macierz kowariancji dla kolumn bmi i tc w zbiorze dia oraz w symulowanych wynikach z df_results – oceń, czy wyniki są zbliżone.

ćwiczenie

Porównanie danych symulowanych z historycznymi

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie