Normallik testi
Çok sayıda yaygın hipotez testini içeren güçlü bir istatistiksel araç seti, alttaki verinin normal dağıldığı varsayımına dayanır. Histogram, verinin yaklaşık olarak normal dağılıp dağılmadığına dair ipuçları verebilirken, çeşitli hipotez testleri bu varsayımı doğrudan sınamamıza olanak tanır. Ayrıca, özellikle örneklem boyutları küçükken, histogramlar kutu (bin) sayısına karşı oldukça hassastır.
Bu egzersizde salary_df içinde Austin Şehri çalışanlarının maaş verileriyle çalışacaksın. Özellikle Hispanik itfaiyecilerle ilgileneceksin. Anderson-Darling hipotez testini kullanarak çalışma yıllarının yaklaşık olarak normal dağılıp dağılmadığını analiz edeceksin.
Bu egzersiz
Python'da Çıkarımın Temelleri
kursunun bir parçasıdırEgzersiz talimatları
- Çalışanların
Years of Employmentdeğerlerini gösteren bir histogram çiz. Years of Employmentdeğerlerinin yaklaşık olarak normal dağılıp dağılmadığını görmek için Anderson-Darling normallik testi uygula.- Test
statisticdeğerinin hangicritical_valuesdeğerlerinden büyük olduğunu bul. - Sıfır hipotezinin reddedileceği
significance_level(leri) yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Plot a histogram of the employees' "Years of Employment"
____.plot(kind="____")
plt.show()
# Conduct an Anderson-Darling test using the years of employment from salary_df
result = stats.____(____)
# Print which critical values the test statistic is greater than the critical values
print(result.____ > result.____)
# Print the significance levels at which the null hypothesis is rejected
print(result.____[result.____ > result.____])