Réplicas bootstrap da média e o SEM
Neste exercício, você vai calcular uma estimativa bootstrap da função densidade de probabilidade da média do volume anual de chuva na estação meteorológica de Sheffield. Lembre-se: estamos estimando a média anual de chuva que obteríamos se a estação de Sheffield pudesse repetir todas as medições de 1883 a 2015 indefinidamente. Esta é uma estimativa probabilística da média. Você vai plotar a PDF como um histograma e verá que ela é Normal.
De fato, pode-se mostrar teoricamente que, sob condições não muito restritivas, o valor da média será sempre distribuído normalmente. (Isso não vale em geral, apenas para a média e algumas outras estatísticas.) O desvio padrão dessa distribuição, chamado de erro padrão da média, ou SEM, é dado pelo desvio padrão dos dados dividido pela raiz quadrada do número de pontos. Ou seja, para um conjunto de dados, sem = np.std(data) / np.sqrt(len(data)). Usando hacker stats, você obtém o mesmo resultado sem precisar derivá-lo, mas vai verificar esse resultado a partir de suas réplicas bootstrap.
O conjunto de dados já foi carregado para você em um array chamado rainfall.
Este exercício faz parte do curso
Pensamento Estatístico em Python (Parte 2)
Instruções do exercício
- Gere
10000réplicas bootstrap da média do volume anual de chuva usando sua funçãodraw_bs_reps()e o arrayrainfall. Dica: passenp.meanemfuncpara calcular a média.- Relembrando,
draw_bs_reps()aceita 3 argumentos:data,funcesize.
- Relembrando,
- Calcule e imprima o erro padrão da média de
rainfall.- A fórmula é
np.std(data) / np.sqrt(len(data)).
- A fórmula é
- Calcule e imprima o desvio padrão das suas réplicas bootstrap
bs_replicates. - Faça um histograma das réplicas usando o argumento
normed=Truee50bins. - Clique em Enviar Resposta para ver o gráfico!
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Take 10,000 bootstrap replicates of the mean: bs_replicates
bs_replicates = ____
# Compute and print SEM
sem = ____ / np.sqrt(____)
print(sem)
# Compute and print standard deviation of bootstrap replicates
bs_std = ____
print(bs_std)
# Make a histogram of the results
_ = plt.hist(____, ____=50, ____=True)
_ = plt.xlabel('mean annual rainfall (mm)')
_ = plt.ylabel('PDF')
# Show the plot
plt.show()