MulaiMulai sekarang secara gratis

Menguji kenormalan

Serangkaian alat statistik yang kuat—termasuk beberapa uji hipotesis umum—bergantung pada asumsi bahwa data yang mendasarinya berdistribusi normal. Meskipun histogram dapat memberi petunjuk apakah data kira-kira berdistribusi normal, berbagai uji hipotesis memungkinkan kita menguji asumsi ini secara langsung. Selain itu, histogram sangat sensitif terhadap jumlah bin, terutama ketika ukuran sampel kecil.

Dalam latihan ini, Anda akan bekerja dengan data gaji pegawai Kota Austin dalam salary_df. Secara khusus, Anda akan berfokus pada petugas pemadam kebakaran Hispanik. Anda akan menganalisis apakah lama masa kerja mereka kira-kira berdistribusi normal menggunakan uji hipotesis Anderson–Darling.

Latihan ini adalah bagian dari kursus

Dasar-dasar Inferensi di Python

Lihat Kursus

Petunjuk latihan

  • Buat histogram yang menampilkan Years of Employment untuk para pegawai.
  • Lakukan uji Anderson–Darling untuk kenormalan guna melihat apakah Years of Employment kira-kira berdistribusi normal.
  • Temukan critical_values mana yang nilainya lebih kecil daripada statistic (yakni, nilai kritis yang dilampaui oleh statistik uji).
  • Cetak significance_level yang menjadi tingkat (level) di mana hipotesis nol akan ditolak.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Plot a histogram of the employees' "Years of Employment"
____.plot(kind="____")
plt.show()

# Conduct an Anderson-Darling test using the years of employment from salary_df
result = stats.____(____)

# Print which critical values the test statistic is greater than the critical values
print(result.____ > result.____)

# Print the significance levels at which the null hypothesis is rejected
print(result.____[result.____ > result.____])
Edit dan Jalankan Kode