ComeçarComece de graça

Réplicas bootstrap de outras estatísticas

Vimos em um exercício anterior que a média é distribuída normalmente. Isso não necessariamente vale para outras estatísticas, mas sem problema: como hackers, sempre podemos gerar réplicas bootstrap! Neste exercício, você vai gerar réplicas bootstrap para a variância da precipitação anual na Estação Meteorológica de Sheffield e traçar o histograma das réplicas.

Aqui, você vai usar a função draw_bs_reps() que definiu alguns exercícios atrás. Ela está abaixo para sua referência:

def draw_bs_reps(data, func, size=1):
    """Draw bootstrap replicates."""
    # Initialize array of replicates
    bs_replicates = np.empty(size)
    # Generate replicates
    for i in range(size):
        bs_replicates[i] = bootstrap_replicate_1d(data, func)
    return bs_replicates

Este exercício faz parte do curso

Pensamento Estatístico em Python (Parte 2)

Ver curso

Instruções do exercício

  • Gere 10000 réplicas bootstrap da variância da precipitação anual, armazenada no conjunto de dados rainfall, usando sua função draw_bs_reps(). Dica: passe np.var para calcular a variância.
  • Divida suas réplicas de variância (bs_replicates) por 100 para colocar a variância em unidades de centímetros quadrados, por conveniência.
  • Faça um histograma de bs_replicates usando o argumento normed=True e 50 bins.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Generate 10,000 bootstrap replicates of the variance: bs_replicates
bs_replicates = ____

# Put the variance in units of square centimeters
____

# Make a histogram of the results
_ = plt.hist(____, ____, ____)
_ = plt.xlabel('variance of annual rainfall (sq. cm)')
_ = plt.ylabel('PDF')

# Show the plot
plt.show()
Editar e executar o código