ComeçarComece de graça

Réplicas bootstrap da média e o SEM

Neste exercício, você vai calcular uma estimativa bootstrap da função densidade de probabilidade da média do volume anual de chuva na estação meteorológica de Sheffield. Lembre-se: estamos estimando a média anual de chuva que obteríamos se a estação de Sheffield pudesse repetir todas as medições de 1883 a 2015 indefinidamente. Esta é uma estimativa probabilística da média. Você vai plotar a PDF como um histograma e verá que ela é Normal.

De fato, pode-se mostrar teoricamente que, sob condições não muito restritivas, o valor da média será sempre distribuído normalmente. (Isso não vale em geral, apenas para a média e algumas outras estatísticas.) O desvio padrão dessa distribuição, chamado de erro padrão da média, ou SEM, é dado pelo desvio padrão dos dados dividido pela raiz quadrada do número de pontos. Ou seja, para um conjunto de dados, sem = np.std(data) / np.sqrt(len(data)). Usando hacker stats, você obtém o mesmo resultado sem precisar derivá-lo, mas vai verificar esse resultado a partir de suas réplicas bootstrap.

O conjunto de dados já foi carregado para você em um array chamado rainfall.

Este exercício faz parte do curso

Pensamento Estatístico em Python (Parte 2)

Ver curso

Instruções do exercício

  • Gere 10000 réplicas bootstrap da média do volume anual de chuva usando sua função draw_bs_reps() e o array rainfall. Dica: passe np.mean em func para calcular a média.
    • Relembrando, draw_bs_reps() aceita 3 argumentos: data, func e size.
  • Calcule e imprima o erro padrão da média de rainfall.
    • A fórmula é np.std(data) / np.sqrt(len(data)).
  • Calcule e imprima o desvio padrão das suas réplicas bootstrap bs_replicates.
  • Faça um histograma das réplicas usando o argumento normed=True e 50 bins.
  • Clique em Enviar Resposta para ver o gráfico!

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Take 10,000 bootstrap replicates of the mean: bs_replicates
bs_replicates = ____

# Compute and print SEM
sem = ____ / np.sqrt(____)
print(sem)

# Compute and print standard deviation of bootstrap replicates
bs_std = ____
print(bs_std)

# Make a histogram of the results
_ = plt.hist(____, ____=50, ____=True)
_ = plt.xlabel('mean annual rainfall (mm)')
_ = plt.ylabel('PDF')

# Show the plot
plt.show()
Editar e executar o código