ComeçarComece de graça

Visualizando amostras bootstrap

Neste exercício, você vai gerar amostras bootstrap a partir do conjunto de dados anuais de precipitação medidos na estação meteorológica de Sheffield, no Reino Unido, de 1883 a 2015. Os dados estão armazenados no array do NumPy rainfall em milímetros (mm). Ao exibir graficamente as amostras bootstrap com uma ECDF, você pode entender como a amostragem bootstrap permite descrições probabilísticas dos dados.

Este exercício faz parte do curso

Pensamento Estatístico em Python (Parte 2)

Ver curso

Instruções do exercício

  • Escreva um for para obter 50 amostras bootstrap dos dados de precipitação e plotar suas ECDFs.
    • Use np.random.choice() para gerar uma amostra bootstrap a partir do array do NumPy rainfall. Garanta que o size do array reamostrado seja len(rainfall).
    • Use a função ecdf() que você escreveu no prequel deste curso para gerar os valores x e y da ECDF da amostra bootstrap bs_sample.
    • Plote os valores da ECDF. Especifique color='gray' (para pontos cinza) e alpha=0.1 (para deixá-los semitransparentes, já que vamos sobrepor muitos) além dos argumentos marker='.' e linestyle='none'.
  • Use ecdf() para gerar os valores x e y da ECDF dos dados originais de precipitação disponíveis no array rainfall.
  • Plote os valores da ECDF dos dados originais.
  • Clique em Enviar para visualizar as amostras!

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

for _ in range(50):
    # Generate bootstrap sample: bs_sample
    bs_sample = ____(____, size=____)

    # Compute and plot ECDF from bootstrap sample
    x, y = ____
    _ = plt.plot(____, ____, ____='.', ____='none',
                 ____='gray', ____=0.1)

# Compute and plot ECDF from original data
x, y = ____
_ = plt.plot(____, ____, ____='.')

# Make margins and label axes
plt.margins(0.02)
_ = plt.xlabel('yearly rainfall (mm)')
_ = plt.ylabel('ECDF')

# Show the plot
plt.show()
Editar e executar o código