1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 2)

Connected

ćwiczenie

Mierzenie odziedziczalności

Pamiętaj, że współczynnik korelacji Pearsona to iloraz kowariancji i średniej geometrycznej wariancji obu zbiorów danych. Jest to miara korelacji między rodzicami a potomstwem, ale niekoniecznie najlepsze oszacowanie odziedziczalności. Jeśli się nad tym zastanowić, bardziej sensowne jest zdefiniowanie odziedziczalności jako ilorazu kowariancji między rodzicami a potomstwem i wariancji wyłącznie rodziców. W tym ćwiczeniu oszacujesz odziedziczalność i wykonasz bootstrap par, aby uzyskać 95-procentowy przedział ufności.

To ćwiczenie ilustruje bardzo ważną kwestię. Wnioskowanie statystyczne (i analiza danych w ogóle) to nie mechaniczne stosowanie gotowych wzorów. Trzeba dokładnie przemyśleć pytania, na które chcesz odpowiedzieć na podstawie danych, i odpowiednio dobrać metody analizy. Jeśli interesuje cię dziedziczność cech, zdefiniowana tu odziedziczalność jest trafniejszą miarą niż gotowy do użycia współczynnik korelacji Pearsona.

Pamiętaj, że dane są przechowywane w zmiennych bd_parent_scandens, bd_offspring_scandens, bd_parent_fortis i bd_offspring_fortis.

Instrukcje

100 XP
  • Napisz funkcję heritability(parents, offspring), która oblicza odziedziczalność jako iloraz kowariancji cechy u rodziców i potomstwa przez wariancję cechy u rodziców. Podpowiedź: Przypomnij sobie funkcję np.cov(), którą omawialiśmy w pierwszej części tego kursu.
  • Użyj tej funkcji, aby obliczyć odziedziczalność dla G. scandens i G. fortis.
  • Wygeneruj 1000 replikacji bootstrap odziedziczalności metodą bootstrap par dla G. scandens i G. fortis.
  • Oblicz 95-procentowy przedział ufności dla obu gatunków na podstawie replikacji bootstrap.
  • Wydrukuj wyniki.