Banyak bootstrap dengan beeswarm
Sebagai penduduk Cincinnati saat ini, Anda penasaran ingin melihat bagaimana nilai rata-rata NO2 dibandingkan dengan Des Moines, Indianapolis, dan Houston: beberapa kota lain tempat Anda pernah tinggal.
Untuk meninjau hal ini, Anda memutuskan menggunakan estimasi bootstrap untuk melihat nilai mean NO2 untuk tiap kota. Karena perbandingan menjadi fokus utama, Anda akan menggunakan swarm plot untuk membandingkan estimasi tersebut.
DataFrame pollution_may disediakan bersama fungsi bootstrap() yang ditunjukkan pada slide untuk melakukan bootstrap resampling.
Latihan ini adalah bagian dari kursus
Meningkatkan Visualisasi Data Anda di Python
Petunjuk latihan
- Jalankan bootstrap resampling pada setiap vektor
city_NO2. - Tambahkan nama kota sebagai sebuah kolom pada DataFrame bootstrap,
cur_boot. - Warnai semua titik pada swarm plot dengan
'coral'untuk menghindari masalah warna-ukuran.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Initialize a holder DataFrame for bootstrap results
city_boots = pd.DataFrame()
for city in ['Cincinnati', 'Des Moines', 'Indianapolis', 'Houston']:
# Filter to city
city_NO2 = pollution_may[pollution_may.city == city].NO2
# Bootstrap city data & put in DataFrame
cur_boot = pd.DataFrame({'NO2_avg': bootstrap(____, 100), 'city': ____})
# Append to other city's bootstraps
city_boots = pd.concat([city_boots,cur_boot])
# Beeswarm plot of averages with citys on y axis
sns.swarmplot(y = "city", x = "NO2_avg", data = city_boots, ____ = '____')
plt.show()