Po co nam symulacje?

W ostatniej lekcji wykonano wielowymiarowy rozkład normalny, korzystając ze średniej i macierzy kowariancji zbioru dia. Teraz wykorzystasz wyniki symulacji, aby odpowiedzieć na interesujące pytania!

Można by zapytać: po co przeprowadzać symulacje, skoro mamy dane historyczne? Czy nie możemy po prostu użyć ich bezpośrednio?

To bardzo dobre pytanie. Symulacje Monte Carlo opierają się na modelowaniu przy użyciu rozkładów prawdopodobieństwa, które dostarczają pełnego rozkładu prawdopodobieństwa do analizy – w postaci dużej liczby próbek – zamiast ograniczonej liczby punktów danych dostępnych w danych historycznych.

Na przykład można zadać pytanie: jaki jest kwantyl 0,1 zmiennej age dla pacjentów z cukrzycą w naszej symulacji? Nie można odpowiedzieć na to pytanie, korzystając bezpośrednio z danych historycznych dia: zbiór ten zawiera tylko 442 rekordy, więc nie da się wyznaczyć wartości na pozycji jednej tysięcznej. Zamiast tego można wykorzystać wyniki symulacji Monte Carlo – i właśnie to zrobisz!

Zbiór danych dotyczących cukrzycy został wczytany jako ramka danych dia. Zaimportowano dla ciebie następujące biblioteki: pandas jako pd, numpy jako np oraz scipy.stats jako st.

Oblicz kwantyl 0,1 (dolną jedną tysięczną) zmiennej tc na podstawie wyników symulacji.

ćwiczenie

Po co nam symulacje?

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie