Aan de slagGa gratis aan de slag

Erfelijkheid meten

Onthoud dat de Pearson-correlatiecoëfficiënt de verhouding is van de covariantie tot het geometrisch gemiddelde van de varianties van de twee gegevenssets. Dit is een maat voor de correlatie tussen ouders en nakomelingen, maar het is misschien niet de beste schatter voor erfelijkheid. Als je erover nadenkt, is het logischer om erfelijkheid te definiëren als de verhouding van de covariantie tussen ouder en nakomeling tot de variatie van alleen de ouders. In deze oefening schat je de erfelijkheidsgraad en voer je een pairs bootstrap-berekening uit om het 95%-betrouwbaarheidsinterval te krijgen.

Deze oefening benadrukt een heel belangrijk punt. Statistische inferentie (en data-analyse in het algemeen) is geen invuloefening. Je moet goed nadenken over de vragen die je met je data wilt beantwoorden en die vervolgens op de juiste manier analyseren. Als je geïnteresseerd bent in hoe erfelijk eigenschappen zijn, past de grootheid die we als erfelijkheid hebben gedefinieerd beter dan de standaardstatistiek, de Pearson-correlatiecoëfficiënt.

Onthoud dat de data zijn opgeslagen in bd_parent_scandens, bd_offspring_scandens, bd_parent_fortis en bd_offspring_fortis.

Deze oefening maakt deel uit van de cursus

Statistical Thinking in Python (deel 2)

Cursus bekijken

Oefeninstructies

  • Schrijf een functie heritability(parents, offspring) die de erfelijkheidsgraad berekent, gedefinieerd als de verhouding van de covariantie van de eigenschap bij ouders en nakomelingen gedeeld door de variantie van de eigenschap bij de ouders. Hint: herinner jezelf aan de functie np.cov() die we in het eerste deel van deze cursus hebben behandeld.
  • Gebruik deze functie om de erfelijkheid te berekenen voor G. scandens en G. fortis.
  • Verkrijg 1000 bootstrap-replicaten van de erfelijkheidsgraad met pairs bootstrap voor G. scandens en G. fortis.
  • Bereken voor beide het 95%-betrouwbaarheidsinterval met je bootstrap-replicaten.
  • Print de resultaten.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

def heritability(parents, offspring):
    """Compute the heritability from parent and offspring samples."""
    covariance_matrix = np.cov(parents, offspring)
    return ____ / ____

# Compute the heritability
heritability_scandens = ____
heritability_fortis = ____

# Acquire 1000 bootstrap replicates of heritability
replicates_scandens = draw_bs_pairs(
        ____, ____, ____, size=____)
        
replicates_fortis = draw_bs_pairs(
        ____, ____, ____, size=____)


# Compute 95% confidence intervals
conf_int_scandens = ____
conf_int_fortis = ____

# Print results
print('G. scandens:', heritability_scandens, conf_int_scandens)
print('G. fortis:', heritability_fortis, conf_int_fortis)
Code bewerken en uitvoeren