Réplicas bootstrap de outras estatísticas
Vimos em um exercício anterior que a média é distribuída normalmente. Isso não necessariamente vale para outras estatísticas, mas sem problema: como hackers, sempre podemos gerar réplicas bootstrap! Neste exercício, você vai gerar réplicas bootstrap para a variância da precipitação anual na Estação Meteorológica de Sheffield e traçar o histograma das réplicas.
Aqui, você vai usar a função draw_bs_reps() que definiu alguns exercícios atrás. Ela está abaixo para sua referência:
def draw_bs_reps(data, func, size=1):
"""Draw bootstrap replicates."""
# Initialize array of replicates
bs_replicates = np.empty(size)
# Generate replicates
for i in range(size):
bs_replicates[i] = bootstrap_replicate_1d(data, func)
return bs_replicates
Este exercício faz parte do curso
Pensamento Estatístico em Python (Parte 2)
Instruções do exercício
- Gere
10000réplicas bootstrap da variância da precipitação anual, armazenada no conjunto de dadosrainfall, usando sua funçãodraw_bs_reps(). Dica: passenp.varpara calcular a variância. - Divida suas réplicas de variância (
bs_replicates) por100para colocar a variância em unidades de centímetros quadrados, por conveniência. - Faça um histograma de
bs_replicatesusando o argumentonormed=Truee50bins.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Generate 10,000 bootstrap replicates of the variance: bs_replicates
bs_replicates = ____
# Put the variance in units of square centimeters
____
# Make a histogram of the results
_ = plt.hist(____, ____, ____)
_ = plt.xlabel('variance of annual rainfall (sq. cm)')
_ = plt.ylabel('PDF')
# Show the plot
plt.show()