Menguji kenormalan
Serangkaian alat statistik yang kuat—termasuk beberapa uji hipotesis umum—bergantung pada asumsi bahwa data yang mendasarinya berdistribusi normal. Meskipun histogram dapat memberi petunjuk apakah data kira-kira berdistribusi normal, berbagai uji hipotesis memungkinkan kita menguji asumsi ini secara langsung. Selain itu, histogram sangat sensitif terhadap jumlah bin, terutama ketika ukuran sampel kecil.
Dalam latihan ini, Anda akan bekerja dengan data gaji pegawai Kota Austin dalam salary_df. Secara khusus, Anda akan berfokus pada petugas pemadam kebakaran Hispanik. Anda akan menganalisis apakah lama masa kerja mereka kira-kira berdistribusi normal menggunakan uji hipotesis Anderson–Darling.
Latihan ini adalah bagian dari kursus
Dasar-dasar Inferensi di Python
Petunjuk latihan
- Buat histogram yang menampilkan
Years of Employmentuntuk para pegawai. - Lakukan uji Anderson–Darling untuk kenormalan guna melihat apakah
Years of Employmentkira-kira berdistribusi normal. - Temukan
critical_valuesmana yang nilainya lebih kecil daripadastatistic(yakni, nilai kritis yang dilampaui oleh statistik uji). - Cetak
significance_levelyang menjadi tingkat (level) di mana hipotesis nol akan ditolak.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Plot a histogram of the employees' "Years of Employment"
____.plot(kind="____")
plt.show()
# Conduct an Anderson-Darling test using the years of employment from salary_df
result = stats.____(____)
# Print which critical values the test statistic is greater than the critical values
print(result.____ > result.____)
# Print the significance levels at which the null hypothesis is rejected
print(result.____[result.____ > result.____])