Mulai sekarangMulai gratis

Menguji kenormalan

Serangkaian alat statistik yang kuat—termasuk beberapa uji hipotesis umum—bergantung pada asumsi bahwa data yang mendasarinya berdistribusi normal. Meskipun histogram dapat memberi petunjuk apakah data kira-kira berdistribusi normal, berbagai uji hipotesis memungkinkan kita menguji asumsi ini secara langsung. Selain itu, histogram sangat sensitif terhadap jumlah bin, terutama ketika ukuran sampel kecil.

Dalam latihan ini, Anda akan bekerja dengan data gaji pegawai Kota Austin dalam salary_df. Secara khusus, Anda akan berfokus pada petugas pemadam kebakaran Hispanik. Anda akan menganalisis apakah lama masa kerja mereka kira-kira berdistribusi normal menggunakan uji hipotesis Anderson–Darling.

Latihan ini merupakan bagian dari kursus

Dasar-dasar Inferensi di Python

Lihat Kursus

Instruksi latihan

  • Buat histogram yang menampilkan Years of Employment untuk para pegawai.
  • Lakukan uji Anderson–Darling untuk kenormalan guna melihat apakah Years of Employment kira-kira berdistribusi normal.
  • Temukan critical_values mana yang nilainya lebih kecil daripada statistic (yakni, nilai kritis yang dilampaui oleh statistik uji).
  • Cetak significance_level yang menjadi tingkat (level) di mana hipotesis nol akan ditolak.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Plot a histogram of the employees' "Years of Employment"
____.plot(kind="____")
plt.show()

# Conduct an Anderson-Darling test using the years of employment from salary_df
result = stats.____(____)

# Print which critical values the test statistic is greater than the critical values
print(result.____ > result.____)

# Print the significance levels at which the null hypothesis is rejected
print(result.____[result.____ > result.____])
Edit dan Jalankan Kode