1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Statistical Thinking in Python (Part 2)

Connected

cvičení

Měření dědivosti

Pearsonův korelační koeficient je podíl kovariance a geometrického průměru rozptylů obou datových sad. Měří korelaci mezi rodiči a potomky, ale nemusí být nejlepším odhadem dědivosti. Když se nad tím zamyslíme, dává větší smysl definovat dědivost jako poměr kovariance rodičů a potomků k rozptylu samotných rodičů. V tomto cvičení odhadneš dědivost a pomocí párového bootstrapu vypočítáš 95% interval spolehlivosti.

Toto cvičení poukazuje na velmi důležitý bod. Statistická inference (a analýza dat obecně) není jen mechanické dosazování do vzorců. Je potřeba pečlivě přemýšlet o tom, na jaké otázky chceš svými daty odpovědět, a zvolit odpovídající přístup. Pokud tě zajímá, jak moc jsou znaky dědičné, je námi definovaná dědivost vhodnější mírou než hotová statistika – Pearsonův korelační koeficient.

Nezapomeň, že data jsou uložena v bd_parent_scandens, bd_offspring_scandens, bd_parent_fortis a bd_offspring_fortis.

Pokyny

100 XP
  • Napiš funkci heritability(parents, offspring), která vypočítá dědivost jako podíl kovariance znaku u rodičů a potomků a rozptylu znaku u rodičů. Nápověda: Vzpomeň si na funkci np.cov(), kterou jsme probírali v předchozím kurzu.
  • Pomocí této funkce vypočítej dědivost pro G. scandens a G. fortis.
  • Získej 1000 bootstrap replikátů dědivosti pomocí párového bootstrapu pro G. scandens a G. fortis.
  • Vypočítej 95% interval spolehlivosti pro oba druhy pomocí svých bootstrap replikátů.
  • Výsledky vypiš.