Histogram bootstrap
Anda sedang mempertimbangkan liburan ke Cincinnati pada bulan Mei, namun Anda sangat sensitif terhadap NO2. Anda mengambil data polusi beberapa tahun dari Cincinnati di bulan Mei dan melihat estimasi bootstrap atas rata-rata kadar NO2. Karena Anda hanya memiliki satu estimasi, cara terbaik untuk memvisualisasikan hasil estimasi bootstrap adalah dengan histogram.
Meskipun Anda menyukai intuisi dari histogram bootstrap itu sendiri, pasangan Anda yang akan ikut berlibur lebih menyukai tampilan interval persentil. Untuk mengakomodasi mereka, Anda memutuskan menyorot interval 95% dengan memberi arsiran pada area tersebut.
Latihan ini adalah bagian dari kursus
Meningkatkan Visualisasi Data Anda di Python
Petunjuk latihan
- Berikan fungsi
percentile()persentil atas dan bawah yang diperlukan untuk mendapatkan interval 95%. - Arsiri latar belakang plot pada interval 95%.
- Gambar histogram mean bootstrap dengan 100 bin.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
cinci_may_NO2 = pollution.query("city == 'Cincinnati' & month == 5").NO2
# Generate bootstrap samples
boot_means = bootstrap(cinci_may_NO2, 1000)
# Get lower and upper 95% interval bounds
lower, upper = np.percentile(boot_means, [____, ____])
# Plot shaded area for interval
plt.axvspan(____, ____, color = 'gray', alpha = 0.2)
# Draw histogram of bootstrap samples
sns.histplot(____, ____ = 100)
plt.show()