Arı sürüsü grafikleriyle bolca bootstrap
Cincinnati'de yaşayan biri olarak, ortalama NO2 değerlerinin, daha önce yaşadığın birkaç şehir olan Des Moines, Indianapolis ve Houston ile nasıl karşılaştığını merak ediyorsun.
Bunu incelemek için, her şehir için ortalama NO2 değerlerine bakmak üzere bootstrap kestirimi kullanmaya karar verdin. Karşılaştırmalar birincil ilgi alanın olduğundan, kestirimleri karşılaştırmak için bir swarm (arı sürüsü) grafiği kullanacaksın.
Bootstrap yeniden örnekleme yapmak için slaytlarda gördüğün bootstrap() fonksiyonuyla birlikte pollution_may DataFrame'i sağlanmıştır.
Bu egzersiz
Python'da Veri Görselleştirmelerini İyileştirme
kursunun bir parçasıdırEgzersiz talimatları
- Her bir
city_NO2vektörü üzerinde bootstrap yeniden örnekleme çalıştır. - Bootstrap DataFrame'i
cur_bootiçine şehir adını bir sütun olarak ekle. - Renk-boyut sorunundan kaçınmak için tüm swarm grafik noktalarını
'coral'olarak renklendir.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Initialize a holder DataFrame for bootstrap results
city_boots = pd.DataFrame()
for city in ['Cincinnati', 'Des Moines', 'Indianapolis', 'Houston']:
# Filter to city
city_NO2 = pollution_may[pollution_may.city == city].NO2
# Bootstrap city data & put in DataFrame
cur_boot = pd.DataFrame({'NO2_avg': bootstrap(____, 100), 'city': ____})
# Append to other city's bootstraps
city_boots = pd.concat([city_boots,cur_boot])
# Beeswarm plot of averages with citys on y axis
sns.swarmplot(y = "city", x = "NO2_avg", data = city_boots, ____ = '____')
plt.show()