ComeçarComece gratuitamente

Bootstrapping de um intervalo de confiança

Uma ferramenta útil para avaliar a variabilidade de alguns dados é o bootstrap. Neste exercício, você escreverá sua própria função de bootstrapping que pode ser usada para retornar um intervalo de confiança bootstrapped.

Essa função recebe três parâmetros: uma matriz 2-D de números (data), uma lista de percentis a serem calculados (percentiles) e o número de iterações boostrap a serem usadas (n_boots). Ele usa a função resample para gerar uma amostra de bootstrap e, em seguida, repete isso várias vezes para calcular o intervalo de confiança.

Este exercício faz parte do curso

Aprendizado de máquina para dados de séries temporais em Python

Ver Curso

Instruções de exercício

  • A função deve percorrer o número de bootstraps (fornecido pelo parâmetro n_boots) e:

    • Pegue uma amostra aleatória dos dados, com substituição, e calcule a média dessa amostra aleatória

    • Calcule os percentis de bootstrap_means e retorne-os

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

from sklearn.utils import ____

def bootstrap_interval(data, percentiles=(2.5, 97.5), n_boots=100):
    """Bootstrap a confidence interval for the mean of columns of a 2-D dataset."""
    # Create our empty array to fill the results
    bootstrap_means = np.zeros([n_boots, data.shape[-1]])
    for ii in range(____):
        # Generate random indices for our data *with* replacement, then take the sample mean
        random_sample = ____
        bootstrap_means[ii] = random_sample.mean(axis=0)
        
    # Compute the percentiles of choice for the bootstrapped means
    percentiles = ____(bootstrap_means, percentiles, axis=0)
    return percentiles
Editar e executar código