1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Úvod do lineárního modelování v Pythonu

Connected

cvičení

Bootstrap a standardní chyba

Představ si národní park, kde rangeři každý den chodí po stezkách jako součást jejich údržby. Ne vždy jdou stejnou trasou, ale vždy si zaznamenají celkovou vzdálenost a čas. Chceme sestavit statistický model variací denně uražené vzdálenosti z omezeného vzorku dat jednoho rangera.

Tvým cílem je využít bootstrapové převzorkování – spočítat jeden průměr pro každý převzorek – a vytvořit tak rozdělení průměrů. Poté vypočítáš standardní chybu jako způsob, jak kvantifikovat „nejistotu" ve výběrové statistice jako odhadu populační statistiky.

Použij předem načtené pole sample_data s 500 nezávislými měřeními uražené vzdálenosti. Zatím pracujeme se simulovanými daty, aby byla tato lekce přehledná. Realistická data uvidíš později.

Pokyny

100 XP
  • Přiřaď sample_data jako model populace.

  • Opakuj num_resamples krát:

    • Pokaždé použij np.random.choice() k vytvoření bootstrap_sample o velikosti size=resample_size odebraného z population_model a nastav replace=True.
    • Pokaždé vypočítej a ulož výběrový průměr.
  • Vypočítej a vypiš np.mean() a np.std() z bootstrap_means.

  • Pomocí předem definované funkce plot_data_hist() vizualizuj rozdělení bootstrap_means.