Güven aralığı için bootstrapping
Verilerdeki değişkenliği değerlendirmek için yararlı bir araç bootstrap yöntemidir. Bu egzersizde, bootstrapped bir güven aralığı döndürebilen kendi bootstrapping fonksiyonunu yazacaksın.
Bu fonksiyon üç parametre alır: sayılardan oluşan 2-B bir dizi (data), hesaplanacak yüzdeliklerin listesi (percentiles) ve kullanılacak bootstrap yineleme sayısı (n_boots). resample fonksiyonunu kullanarak bir bootstrap örneği üretir ve bunu birçok kez tekrarlayarak güven aralığını hesaplar.
Bu egzersiz
Python ile Zaman Serisi Verileri için Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Fonksiyon, bootstrap sayısı (parametre
n_bootsile verilen) kadar döngü kurmalı ve:- Veriden yerine koymalı rastgele bir örnek alıp, bu rastgele örneğin ortalamasını hesaplamalı
bootstrap_meansiçin yüzdelikleri hesaplayıp döndürmeli
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
from sklearn.utils import ____
def bootstrap_interval(data, percentiles=(2.5, 97.5), n_boots=100):
"""Bootstrap a confidence interval for the mean of columns of a 2-D dataset."""
# Create our empty array to fill the results
bootstrap_means = np.zeros([n_boots, data.shape[-1]])
for ii in range(____):
# Generate random indices for our data *with* replacement, then take the sample mean
random_sample = ____
bootstrap_means[ii] = random_sample.mean(axis=0)
# Compute the percentiles of choice for the bootstrapped means
percentiles = ____(bootstrap_means, percentiles, axis=0)
return percentiles