Visualizando amostras bootstrap
Neste exercício, você vai gerar amostras bootstrap a partir do conjunto de dados anuais de precipitação medidos na estação meteorológica de Sheffield, no Reino Unido, de 1883 a 2015. Os dados estão armazenados no array do NumPy rainfall em milímetros (mm). Ao exibir graficamente as amostras bootstrap com uma ECDF, você pode entender como a amostragem bootstrap permite descrições probabilísticas dos dados.
Este exercício faz parte do curso
Pensamento Estatístico em Python (Parte 2)
Instruções do exercício
- Escreva um
forpara obter50amostras bootstrap dos dados de precipitação e plotar suas ECDFs.- Use
np.random.choice()para gerar uma amostra bootstrap a partir do array do NumPyrainfall. Garanta que osizedo array reamostrado sejalen(rainfall). - Use a função
ecdf()que você escreveu no prequel deste curso para gerar os valoresxeyda ECDF da amostra bootstrapbs_sample. - Plote os valores da ECDF. Especifique
color='gray'(para pontos cinza) ealpha=0.1(para deixá-los semitransparentes, já que vamos sobrepor muitos) além dos argumentosmarker='.'elinestyle='none'.
- Use
- Use
ecdf()para gerar os valoresxeyda ECDF dos dados originais de precipitação disponíveis no arrayrainfall. - Plote os valores da ECDF dos dados originais.
- Clique em Enviar para visualizar as amostras!
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
for _ in range(50):
# Generate bootstrap sample: bs_sample
bs_sample = ____(____, size=____)
# Compute and plot ECDF from bootstrap sample
x, y = ____
_ = plt.plot(____, ____, ____='.', ____='none',
____='gray', ____=0.1)
# Compute and plot ECDF from original data
x, y = ____
_ = plt.plot(____, ____, ____='.')
# Make margins and label axes
plt.margins(0.02)
_ = plt.xlabel('yearly rainfall (mm)')
_ = plt.ylabel('ECDF')
# Show the plot
plt.show()