Bootstrap de um intervalo de confiança
Uma ferramenta útil para avaliar a variabilidade de alguns dados é o bootstrap. Neste exercício, você vai escrever sua própria função de bootstrap que pode ser usada para retornar um intervalo de confiança por bootstrap.
Essa função recebe três parâmetros: um array 2-D de números (data), uma lista de percentis a calcular (percentiles) e o número de iterações de bootstrap a usar (n_boots). Ela usa a função resample para gerar uma amostra de bootstrap e repete isso várias vezes para calcular o intervalo de confiança.
Este exercício faz parte do curso
Machine Learning para dados de séries temporais em Python
Instruções do exercício
- A função deve iterar pelo número de bootstraps (dado pelo parâmetro
n_boots) e:- Tirar uma amostra aleatória dos dados, com reposição, e calcular a média dessa amostra aleatória
- Calcular os percentis de
bootstrap_meanse retorná-los
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
from sklearn.utils import ____
def bootstrap_interval(data, percentiles=(2.5, 97.5), n_boots=100):
"""Bootstrap a confidence interval for the mean of columns of a 2-D dataset."""
# Create our empty array to fill the results
bootstrap_means = np.zeros([n_boots, data.shape[-1]])
for ii in range(____):
# Generate random indices for our data *with* replacement, then take the sample mean
random_sample = ____
bootstrap_means[ii] = random_sample.mean(axis=0)
# Compute the percentiles of choice for the bootstrapped means
percentiles = ____(bootstrap_means, percentiles, axis=0)
return percentiles