CommencerCommencer gratuitement

Mesurer l’héritabilité

Rappelez‑vous que le coefficient de corrélation de Pearson est le rapport entre la covariance et la moyenne géométrique des variances des deux jeux de données. C’est une mesure de la corrélation entre parents et descendants, mais ce n’est peut‑être pas la meilleure estimation de l’héritabilité. Si l’on y réfléchit, il est plus logique de définir l’héritabilité comme le rapport entre la covariance entre parents et descendants et la variance des seuls parents. Dans cet exercice, vous allez estimer l’héritabilité et effectuer un bootstrap par paires pour obtenir l’intervalle de confiance à 95 %.

Cet exercice met en évidence un point crucial. L’inférence statistique (et l’analyse de données en général) n’est pas une simple démarche « plug‑and‑play ». Vous devez réfléchir soigneusement aux questions auxquelles vous souhaitez répondre avec vos données et les analyser en conséquence. Si vous cherchez à savoir dans quelle mesure les caractères sont héréditaires, la quantité que nous avons définie comme l’héritabilité est plus adaptée que la statistique « prête à l’emploi » qu’est le coefficient de corrélation de Pearson.

Rappelez‑vous que les données sont stockées dans bd_parent_scandens, bd_offspring_scandens, bd_parent_fortis et bd_offspring_fortis.

Cet exercice fait partie du cours

Réflexion statistique en Python (Partie 2)

Afficher le cours

Instructions

  • Écrivez une fonction heritability(parents, offspring) qui calcule l’héritabilité, définie comme le rapport entre la covariance du caractère chez les parents et les descendants et la variance du caractère chez les parents. Indice : rappelez‑vous la fonction np.cov() que nous avons vue dans la première partie de ce cours.
  • Utilisez cette fonction pour calculer l’héritabilité de G. scandens et G. fortis.
  • Obtenez 1000 répliques bootstrap de l’héritabilité en utilisant un bootstrap par paires pour G. scandens et G. fortis.
  • Calculez l’intervalle de confiance à 95 % pour les deux espèces à partir de vos répliques bootstrap.
  • Affichez les résultats.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

def heritability(parents, offspring):
    """Compute the heritability from parent and offspring samples."""
    covariance_matrix = np.cov(parents, offspring)
    return ____ / ____

# Compute the heritability
heritability_scandens = ____
heritability_fortis = ____

# Acquire 1000 bootstrap replicates of heritability
replicates_scandens = draw_bs_pairs(
        ____, ____, ____, size=____)
        
replicates_fortis = draw_bs_pairs(
        ____, ____, ____, size=____)


# Compute 95% confidence intervals
conf_int_scandens = ____
conf_int_fortis = ____

# Print results
print('G. scandens:', heritability_scandens, conf_int_scandens)
print('G. fortis:', heritability_fortis, conf_int_fortis)
Modifier et exécuter le code