Medindo a herdabilidade
Lembre-se de que o coeficiente de correlação de Pearson é a razão entre a covariância e a média geométrica das variâncias dos dois conjuntos de dados. Essa é uma medida da correlação entre pais e descendentes, mas pode não ser a melhor estimativa de herdabilidade. Se pararmos para pensar, faz mais sentido definir herdabilidade como a razão entre a covariância entre pais e descendentes e a variância apenas dos pais. Neste exercício, você vai estimar a herdabilidade e realizar um bootstrap em pares para obter o intervalo de confiança de 95%.
Este exercício destaca um ponto muito importante. Inferência estatística (e análise de dados em geral) não é uma tarefa mecânica de “encher lacuna”. Você precisa pensar com cuidado sobre as perguntas que deseja responder com seus dados e analisá-las de forma apropriada. Se seu interesse é entender quão herdáveis são os traços, a quantidade que definimos como herdabilidade é mais adequada do que a estatística pronta de prateleira, o coeficiente de correlação de Pearson.
Lembre-se: os dados estão armazenados em bd_parent_scandens, bd_offspring_scandens, bd_parent_fortis e bd_offspring_fortis.
Este exercício faz parte do curso
Pensamento Estatístico em Python (Parte 2)
Instruções do exercício
- Escreva uma função
heritability(parents, offspring)que calcule a herdabilidade definida como a razão entre a covariância do traço em pais e descendentes dividida pela variância do traço nos pais. Dica: relembre a funçãonp.cov()que vimos na primeira parte deste curso. - Use essa função para calcular a herdabilidade para G. scandens e G. fortis.
- Obtenha 1000 réplicas bootstrap da herdabilidade usando bootstrap em pares para G. scandens e G. fortis.
- Calcule o intervalo de confiança de 95% para ambas usando suas réplicas bootstrap.
- Imprima os resultados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def heritability(parents, offspring):
"""Compute the heritability from parent and offspring samples."""
covariance_matrix = np.cov(parents, offspring)
return ____ / ____
# Compute the heritability
heritability_scandens = ____
heritability_fortis = ____
# Acquire 1000 bootstrap replicates of heritability
replicates_scandens = draw_bs_pairs(
____, ____, ____, size=____)
replicates_fortis = draw_bs_pairs(
____, ____, ____, size=____)
# Compute 95% confidence intervals
conf_int_scandens = ____
conf_int_fortis = ____
# Print results
print('G. scandens:', heritability_scandens, conf_int_scandens)
print('G. fortis:', heritability_fortis, conf_int_fortis)