Bootstrapping eines Konfidenzintervalls

Ein nützliches Werkzeug, um die Variabilität von Daten zu beurteilen, ist das Bootstrap-Verfahren. In dieser Übung schreibst du deine eigene Bootstrapping-Funktion, die ein gebootstrapptes Konfidenzintervall zurückgeben kann.

Diese Funktion erhält drei Parameter: ein 2D-Array mit Zahlen (data), eine Liste der zu berechnenden Perzentile (percentiles) und die Anzahl der Bootstrap-Durchläufe (n_boots). Sie verwendet die Funktion resample, um eine Bootstrap-Stichprobe zu erzeugen, und wiederholt dies mehrfach, um das Konfidenzintervall zu berechnen.

Diese Übung ist Teil des Kurses

Maschinelles Lernen für Zeitreihendaten in Python

Kurs anzeigen

Anleitung zur Übung

Die Funktion soll über die Anzahl der Bootstraps (gegeben durch den Parameter n_boots) iterieren und dabei:
- Eine Zufallsstichprobe der Daten mit Zurücklegen ziehen und den Mittelwert dieser Zufallsstichprobe berechnen
- Die Perzentile von bootstrap_means berechnen und zurückgeben

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

from sklearn.utils import ____

def bootstrap_interval(data, percentiles=(2.5, 97.5), n_boots=100):
    """Bootstrap a confidence interval for the mean of columns of a 2-D dataset."""
    # Create our empty array to fill the results
    bootstrap_means = np.zeros([n_boots, data.shape[-1]])
    for ii in range(____):
        # Generate random indices for our data *with* replacement, then take the sample mean
        random_sample = ____
        bootstrap_means[ii] = random_sample.mean(axis=0)
        
    # Compute the percentiles of choice for the bootstrapped means
    percentiles = ____(bootstrap_means, percentiles, axis=0)
    return percentiles

Code bearbeiten und ausführen