1. Learn
  2. /
  3. Cursuri
  4. /
  5. Gândire statistică în Python (Partea 2)

Connected

exercițiu

Măsurarea heritabilității

Reamintește-ți că coeficientul de corelație Pearson este raportul dintre covarianță și media geometrică a varianțelor celor două seturi de date. Aceasta măsoară corelația dintre părinți și descendenți, dar s-ar putea să nu fie cea mai bună estimare a heritabilității. Dacă ne gândim mai bine, are mai mult sens să definim heritabilitatea ca raportul dintre covarianța dintre părinți și descendenți și varianța părinților singuri. În acest exercițiu, vei estima heritabilitatea și vei efectua un calcul bootstrap pe perechi pentru a obține intervalul de încredere de 95%.

Acest exercițiu subliniază un punct foarte important. Inferența statistică (și analiza datelor în general) nu este un proces mecanic de aplicare a formulelor. Trebuie să te gândești cu atenție la întrebările la care vrei să răspunzi cu datele tale și să le analizezi în mod corespunzător. Dacă ești interesat de gradul de heritabilitate al trăsăturilor, cantitatea pe care am definit-o drept heritabilitate este mai potrivită decât statistica standard, coeficientul de corelație Pearson.

Reține că datele sunt stocate în bd_parent_scandens, bd_offspring_scandens, bd_parent_fortis și bd_offspring_fortis.

Instrucțiuni

100 XP
  • Scrie o funcție heritability(parents, offspring) care calculează heritabilitatea definită ca raportul dintre covarianța trăsăturii la părinți și descendenți și varianța trăsăturii la părinți. Indiciu: Reamintește-ți funcția np.cov() pe care am acoperit-o în cursul anterior.
  • Folosește această funcție pentru a calcula heritabilitatea pentru G. scandens și G. fortis.
  • Obține 1000 de replici bootstrap ale heritabilității folosind bootstrap pe perechi pentru G. scandens și G. fortis.
  • Calculează intervalul de încredere de 95% pentru ambele specii folosind replicile bootstrap.
  • Afișează rezultatele.