Distribusi galat
Hampir tidak ada proses dunia nyata yang dapat diprediksi dengan sempurna. Hasil yang diinginkan adalah galat berdistribusi normal. Artinya, beberapa nilai aktual akan berada di atas prediksi Anda, dan sebagian lainnya di bawahnya. Dengan kata lain, galat (yaitu selisih antara nilai aktual dan prediksi) akan tampak “mengambang” secara acak di sekitar nol.
Pada latihan ini, Anda akan menganalisis hasil dari model linear yang telah dibuat sebelumnya untuk memprediksi gaji seorang petugas polisi. Anda kemudian akan melihat galatnya dan memeriksa apakah distribusinya kira-kira normal. Prediksi adalah daftar nilai yang disimpan dalam preds, dan gaji aktual adalah daftar nilai yang disimpan dalam salaries.
Latihan ini adalah bagian dari kursus
Dasar-dasar Inferensi di Python
Petunjuk latihan
- Hitung galat sebagai gaji aktual dikurangi gaji prediksi.
- Plot galat dalam sebuah histogram.
- Lakukan uji kenormalan Anderson–Darling untuk galat.
- Temukan dan cetak
significance_leveltempat hipotesis nol akan ditolak.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Compute the error as actual minus predicted salary
error = ____
# Plot the errors as a histogram
plt.____(____)
plt.show()
# Conduct an Anderson-Darling test using the years of experience
result = ____(____)
# Find where the result is significant
print(result.____[result.____ > result.____])