Erblichkeit messen
Denk daran: Der Pearson-Korrelationskoeffizient ist das Verhältnis der Kovarianz zum geometrischen Mittel der Varianzen der beiden Datensätze. Das misst die Korrelation zwischen Eltern und Nachkommen, ist aber vielleicht keine optimale Schätzung der Erblichkeit. Überlegt man kurz, ergibt es mehr Sinn, Erblichkeit als Verhältnis der Kovarianz zwischen Eltern und Nachkommen zur Varianz der Eltern allein zu definieren. In dieser Übung schätzt du die Erblichkeit und führst ein Pairs-Bootstrap-Verfahren durch, um das 95%-Konfidenzintervall zu erhalten.
Diese Übung betont einen sehr wichtigen Punkt: Statistische Inferenz (und Datenanalyse allgemein) ist kein Schema-F. Du musst genau darüber nachdenken, welche Fragen du mit deinen Daten beantworten willst, und sie entsprechend analysieren. Wenn dich interessiert, wie vererbbar Merkmale sind, ist die von uns definierte Größe zur Erblichkeit passender als die Standardkennzahl, der Pearson-Korrelationskoeffizient.
Zur Erinnerung: Die Daten sind in bd_parent_scandens, bd_offspring_scandens, bd_parent_fortis und bd_offspring_fortis gespeichert.
Diese Übung ist Teil des Kurses
Statistical Thinking in Python (Teil 2)
Anleitung zur Übung
- Schreibe eine Funktion
heritability(parents, offspring), die die Erblichkeit berechnet, definiert als das Verhältnis der Kovarianz des Merkmals zwischen Eltern und Nachkommen zur Varianz des Merkmals bei den Eltern. Hinweis: Erinnere dich an die Funktionnp.cov(), die wir im ersten Teil dieses Kurses behandelt haben. - Verwende diese Funktion, um die Erblichkeit für G. scandens und G. fortis zu berechnen.
- Erzeuge 1000 Bootstrap-Replikate der Erblichkeit mittels Pairs-Bootstrap für G. scandens und G. fortis.
- Berechne für beide mithilfe deiner Bootstrap-Replikate das 95%-Konfidenzintervall.
- Gib die Ergebnisse aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
def heritability(parents, offspring):
"""Compute the heritability from parent and offspring samples."""
covariance_matrix = np.cov(parents, offspring)
return ____ / ____
# Compute the heritability
heritability_scandens = ____
heritability_fortis = ____
# Acquire 1000 bootstrap replicates of heritability
replicates_scandens = draw_bs_pairs(
____, ____, ____, size=____)
replicates_fortis = draw_bs_pairs(
____, ____, ____, size=____)
# Compute 95% confidence intervals
conf_int_scandens = ____
conf_int_fortis = ____
# Print results
print('G. scandens:', heritability_scandens, conf_int_scandens)
print('G. fortis:', heritability_fortis, conf_int_fortis)