LoslegenKostenlos loslegen

Bootstrapping eines Konfidenzintervalls

Ein nützliches Werkzeug, um die Variabilität von Daten zu beurteilen, ist das Bootstrap-Verfahren. In dieser Übung schreibst du deine eigene Bootstrapping-Funktion, die ein gebootstrapptes Konfidenzintervall zurückgeben kann.

Diese Funktion erhält drei Parameter: ein 2D-Array mit Zahlen (data), eine Liste der zu berechnenden Perzentile (percentiles) und die Anzahl der Bootstrap-Durchläufe (n_boots). Sie verwendet die Funktion resample, um eine Bootstrap-Stichprobe zu erzeugen, und wiederholt dies mehrfach, um das Konfidenzintervall zu berechnen.

Diese Übung ist Teil des Kurses

Maschinelles Lernen für Zeitreihendaten in Python

Kurs anzeigen

Anleitung zur Übung

  • Die Funktion soll über die Anzahl der Bootstraps (gegeben durch den Parameter n_boots) iterieren und dabei:
    • Eine Zufallsstichprobe der Daten mit Zurücklegen ziehen und den Mittelwert dieser Zufallsstichprobe berechnen
    • Die Perzentile von bootstrap_means berechnen und zurückgeben

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

from sklearn.utils import ____

def bootstrap_interval(data, percentiles=(2.5, 97.5), n_boots=100):
    """Bootstrap a confidence interval for the mean of columns of a 2-D dataset."""
    # Create our empty array to fill the results
    bootstrap_means = np.zeros([n_boots, data.shape[-1]])
    for ii in range(____):
        # Generate random indices for our data *with* replacement, then take the sample mean
        random_sample = ____
        bootstrap_means[ii] = random_sample.mean(axis=0)
        
    # Compute the percentiles of choice for the bootstrapped means
    percentiles = ____(bootstrap_means, percentiles, axis=0)
    return percentiles
Code bearbeiten und ausführen