1. Nauka
  2. /
  3. Kursy
  4. /
  5. Symulacje Monte Carlo w Pythonie

Connected

ćwiczenie

Porównanie danych symulowanych z historycznymi

Dobra symulacja powinna dawać wyniki zbliżone do danych historycznych. Czy tak było w przypadku symulacji z filmu? W tym ćwiczeniu sprawdzisz jeden ze sposobów oceny wyników symulacji!

Najpierw przeprowadzisz symulację z wykorzystaniem wielowymiarowego rozkładu normalnego oraz średniej i macierzy kowariancji zbioru dia. Następnie porównasz średnie wartości danych historycznych i symulowanych. Czy są do siebie podobne?

Zbiór danych dotyczący cukrzycy został wczytany jako DataFrame dia. Zaimportowano dla ciebie następujące biblioteki: pandas jako pd, numpy jako np oraz scipy.stats jako st.

Instrukcje

100 XP
  • Przeprowadź symulację 10 000 razy, korzystając z wielowymiarowego rozkładu normalnego oraz średniej i macierzy kowariancji zbioru dia.
  • Użyj funkcji .mean() z biblioteki pandas, aby obliczyć średnie wartości kolumn bmi i tc w historycznym zbiorze danych dia oraz w symulowanych wynikach z df_results – sprawdź, czy są do siebie podobne.
  • Podobnie, użyj .cov() z pandas, aby obliczyć macierz kowariancji dla kolumn bmi i tc w zbiorze dia oraz w symulowanych wynikach z df_results – oceń, czy wyniki są zbliżone.