Correlação entre dados de filhotes e pais
Para quantificar a correlação entre as profundidades de bico de filhotes e de pais, queremos calcular estatísticas, como o coeficiente de correlação de Pearson, entre pais e filhotes. Para obter intervalos de confiança disso, precisamos fazer um pairs bootstrap.
Você já escreveu uma função para fazer pairs bootstrap e obter estimativas de parâmetros derivados de regressão linear. Sua tarefa neste exercício é criar uma nova função com a assinatura draw_bs_pairs(x, y, func, size=1) que realiza o pairs bootstrap e calcula uma única estatística nos pares amostrados. A estatística de interesse é calculada chamando func(bs_x, bs_y). No próximo exercício, você usará pearson_r como func.
Este exercício faz parte do curso
Pensamento Estatístico em Python (Parte 2)
Instruções do exercício
- Defina um array de índices para amostrar. (Lembre-se: ao fazer pairs bootstrap, escolhemos índices aleatoriamente e usamos esses índices para obter os pares.)
- Inicialize o array de réplicas bootstrap. Deve ser um array unidimensional de comprimento
size. - Escreva um loop
forpara gerar as amostras. - Escolha aleatoriamente índices do array de índices que você definiu anteriormente.
- Extraia os valores de
xe os valores deydo array de entrada usando os índices que você acabou de escolher para gerar uma amostra bootstrap. - Use
funcpara calcular a estatística de interesse a partir das amostras bootstrap dexeye armazene-a no seu array de réplicas bootstrap. - Retorne o array de réplicas bootstrap.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
def draw_bs_pairs(x, y, func, size=1):
"""Perform pairs bootstrap for a single statistic."""
# Set up array of indices to sample from: inds
inds = ____
# Initialize replicates: bs_replicates
bs_replicates = ____
# Generate replicates
for i in range(size):
bs_inds = ____
bs_x, bs_y = ____
bs_replicates[i] = ____
return bs_replicates