Bootstrap a standardní chyba

Představ si národní park, kde rangeři každý den chodí po stezkách jako součást jejich údržby. Ne vždy jdou stejnou trasou, ale vždy si zaznamenají celkovou vzdálenost a čas. Chceme sestavit statistický model variací denně uražené vzdálenosti z omezeného vzorku dat jednoho rangera.

Tvým cílem je využít bootstrapové převzorkování – spočítat jeden průměr pro každý převzorek – a vytvořit tak rozdělení průměrů. Poté vypočítáš standardní chybu jako způsob, jak kvantifikovat „nejistotu" ve výběrové statistice jako odhadu populační statistiky.

Použij předem načtené pole sample_data s 500 nezávislými měřeními uražené vzdálenosti. Zatím pracujeme se simulovanými daty, aby byla tato lekce přehledná. Realistická data uvidíš později.

Přiřaď sample_data jako model populace.
Opakuj num_resamples krát:
- Pokaždé použij np.random.choice() k vytvoření bootstrap_sample o velikosti size=resample_size odebraného z population_model a nastav replace=True.
- Pokaždé vypočítej a ulož výběrový průměr.
Vypočítej a vypiš np.mean() a np.std() z bootstrap_means.
Pomocí předem definované funkce plot_data_hist() vizualizuj rozdělení bootstrap_means.

cvičení

Bootstrap a standardní chyba

Pokyny

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení