MulaiMulai sekarang secara gratis

Interval kepercayaan dasar

Anda adalah data scientist untuk sebuah produsen kembang api di Des Moines, Iowa. Anda perlu meyakinkan pihak kota bahwa pertunjukan kembang api besar dari perusahaan Anda tidak menyebabkan kerusakan pada kualitas udara kota. Untuk itu, Anda melihat rata-rata tingkat polutan pada minggu setelah tanggal empat Juli dan membandingkannya dengan pengukuran setelah pertunjukan terakhir Anda. Dengan menampilkan interval kepercayaan di sekitar nilai rata-rata, Anda dapat menunjukkan bahwa pengukuran terbaru masih berada dalam kisaran normal.

Data ini dimuat sebagai average_ests dengan satu baris untuk setiap polutan yang diukur.

Latihan ini adalah bagian dari kursus

Meningkatkan Visualisasi Data Anda di Python

Lihat Kursus

Petunjuk latihan

  • Buat batas bawah dan atas untuk interval 95%:

    • Buat batas bawah dengan mengurangkan 1,96 standar error ('std_err') dari 'mean' estimasi.
    • Buat batas atas dengan menambahkan 1,96 standar error ('std_err') ke 'mean' estimasi.
  • Berikan pollutant sebagai variabel facet ke sns.FacetGrid() dan lepaskan keterkaitan sumbu-x pada plot agar ukuran interval proporsional.

  • Berikan batas interval yang telah dibuat ke fungsi plt.hlines() yang dipetakan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Construct CI bounds for averages
average_ests['lower'] = average_ests['____'] - 1.96*average_ests['____']
average_ests['upper'] = average_ests['____'] + 1.96*average_ests['____']

# Setup a grid of plots, with non-shared x axes limits
g = sns.FacetGrid(average_ests, row = '____', ____ = False)

# Plot CI for average estimate
g.map(plt.hlines, 'y', '____', '____')

# Plot observed values for comparison and remove axes labels
g.map(plt.scatter, 'seen', 'y', color = 'orangered').set_ylabels('').set_xlabels('') 

plt.show()
Edit dan Jalankan Kode