Executando um bootstrap simples
Bem-vindo ao primeiro exercício da seção de bootstrapping. Vamos trabalhar em um exemplo para aprender a executar um bootstrap simples. Como vimos no vídeo, a ideia principal por trás do bootstrapping é amostrar com reposição.
Suponha que você seja dono de uma fábrica que produz chaves inglesas. Você quer caracterizar o comprimento médio das chaves e garantir que elas atendam a certas especificações. Sua fábrica produz milhares de chaves por dia, mas é inviável medir o comprimento de cada uma. Porém, você tem acesso a uma amostra representativa de 100 chaves. Vamos usar bootstrapping para obter o intervalo de confiança (IC) de 95% para os comprimentos médios.
Examine a lista wrench_lengths, que contém 100 comprimentos observados de chaves, no shell.
Este exercício faz parte do curso
Simulação Estatística em Python
Instruções do exercício
- Faça uma amostra aleatória com reposição de
wrench_lengthse armazene emtemp_sample. Definasize = len(wrench_lengths). - Calcule o comprimento médio de cada amostra, atribua a
sample_meane depois acrescente amean_lengths. - Calcule a média via bootstrap (
boot_mean) e o intervalo de confiança de 95% via bootstrap (boot_95_ci) usandonp.percentile().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Draw some random sample with replacement and append mean to mean_lengths.
mean_lengths, sims = [], 1000
for i in range(sims):
temp_sample = ____(____, replace=____, size=____)
sample_mean = ____
mean_lengths.append(sample_mean)
# Calculate bootstrapped mean and 95% confidence interval.
boot_mean = np.mean(____)
boot_95_ci = ____(mean_lengths, [2.5, 97.5])
print("Bootstrapped Mean Length = {}, 95% CI = {}".format(boot_mean, boot_95_ci))