Mulai sekarangMulai gratis

Banyak bootstrap dengan beeswarm

Sebagai penduduk Cincinnati saat ini, Anda penasaran ingin melihat bagaimana nilai rata-rata NO2 dibandingkan dengan Des Moines, Indianapolis, dan Houston: beberapa kota lain tempat Anda pernah tinggal.

Untuk meninjau hal ini, Anda memutuskan menggunakan estimasi bootstrap untuk melihat nilai mean NO2 untuk tiap kota. Karena perbandingan menjadi fokus utama, Anda akan menggunakan swarm plot untuk membandingkan estimasi tersebut.

DataFrame pollution_may disediakan bersama fungsi bootstrap() yang ditunjukkan pada slide untuk melakukan bootstrap resampling.

Latihan ini merupakan bagian dari kursus

Meningkatkan Visualisasi Data Anda di Python

Lihat Kursus

Instruksi latihan

  • Jalankan bootstrap resampling pada setiap vektor city_NO2.
  • Tambahkan nama kota sebagai sebuah kolom pada DataFrame bootstrap, cur_boot.
  • Warnai semua titik pada swarm plot dengan 'coral' untuk menghindari masalah warna-ukuran.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Initialize a holder DataFrame for bootstrap results
city_boots = pd.DataFrame()

for city in ['Cincinnati', 'Des Moines', 'Indianapolis', 'Houston']:
    # Filter to city
    city_NO2 = pollution_may[pollution_may.city  ==  city].NO2
    # Bootstrap city data & put in DataFrame
    cur_boot = pd.DataFrame({'NO2_avg': bootstrap(____, 100), 'city': ____})
    # Append to other city's bootstraps
    city_boots = pd.concat([city_boots,cur_boot])

# Beeswarm plot of averages with citys on y axis
sns.swarmplot(y = "city", x = "NO2_avg", data = city_boots, ____ = '____')

plt.show()
Edit dan Jalankan Kode