1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Statistical Thinking in Python (Part 2)

Connected

cvičení

Korelace dat potomků a rodičů

Abychom mohli kvantifikovat korelaci mezi hloubkou zobáku potomků a rodičů, chceme vypočítat statistiky, jako je Pearsonův korelační koeficient, mezi rodiči a potomky. Pro získání intervalů spolehlivosti potřebujeme provést párový bootstrap.

Funkci pro párový bootstrap pro odhad parametrů odvozených z lineární regrese jsi již napsal/a. Tvým úkolem v tomto cvičení je vytvořit novou funkci s hlavičkou draw_bs_pairs(x, y, func, size=1), která provede párový bootstrap a vypočítá jednu statistiku na definovaných párových vzorcích. Sledovaná statistika se vypočítá zavoláním func(bs_x, bs_y). V příštím cvičení použiješ pro func funkci pearson_r.

Pokyny

100 XP
  • Připrav pole indexů pro vzorkování. (Nezapomeň, že při párovém bootstrapu náhodně vybíráme indexy a pomocí nich získáváme páry.)
  • Inicializuj pole bootstrap replikátů. Má to být jednorozměrné pole délky size.
  • Napiš cyklus for pro výběr vzorků.
  • Náhodně vyber indexy z pole indexů, které jsi připravil/a v předchozím kroku.
  • Z vstupního pole vyextrahuj hodnoty x a y pomocí právě vybraných indexů a vytvoř tak bootstrap vzorek.
  • Pomocí func vypočítej sledovanou statistiku z bootstrap vzorků x a y a ulož ji do pole bootstrap replikátů.
  • Vrať pole bootstrap replikátů.