MulaiMulai sekarang secara gratis

Banyak bootstrap dengan beeswarm

Sebagai penduduk Cincinnati saat ini, Anda penasaran ingin melihat bagaimana nilai rata-rata NO2 dibandingkan dengan Des Moines, Indianapolis, dan Houston: beberapa kota lain tempat Anda pernah tinggal.

Untuk meninjau hal ini, Anda memutuskan menggunakan estimasi bootstrap untuk melihat nilai mean NO2 untuk tiap kota. Karena perbandingan menjadi fokus utama, Anda akan menggunakan swarm plot untuk membandingkan estimasi tersebut.

DataFrame pollution_may disediakan bersama fungsi bootstrap() yang ditunjukkan pada slide untuk melakukan bootstrap resampling.

Latihan ini adalah bagian dari kursus

Meningkatkan Visualisasi Data Anda di Python

Lihat Kursus

Petunjuk latihan

  • Jalankan bootstrap resampling pada setiap vektor city_NO2.
  • Tambahkan nama kota sebagai sebuah kolom pada DataFrame bootstrap, cur_boot.
  • Warnai semua titik pada swarm plot dengan 'coral' untuk menghindari masalah warna-ukuran.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Initialize a holder DataFrame for bootstrap results
city_boots = pd.DataFrame()

for city in ['Cincinnati', 'Des Moines', 'Indianapolis', 'Houston']:
    # Filter to city
    city_NO2 = pollution_may[pollution_may.city  ==  city].NO2
    # Bootstrap city data & put in DataFrame
    cur_boot = pd.DataFrame({'NO2_avg': bootstrap(____, 100), 'city': ____})
    # Append to other city's bootstraps
    city_boots = pd.concat([city_boots,cur_boot])

# Beeswarm plot of averages with citys on y axis
sns.swarmplot(y = "city", x = "NO2_avg", data = city_boots, ____ = '____')

plt.show()
Edit dan Jalankan Kode