MulaiMulai sekarang secara gratis

Distribusi galat

Hampir tidak ada proses dunia nyata yang dapat diprediksi dengan sempurna. Hasil yang diinginkan adalah galat berdistribusi normal. Artinya, beberapa nilai aktual akan berada di atas prediksi Anda, dan sebagian lainnya di bawahnya. Dengan kata lain, galat (yaitu selisih antara nilai aktual dan prediksi) akan tampak “mengambang” secara acak di sekitar nol.

Pada latihan ini, Anda akan menganalisis hasil dari model linear yang telah dibuat sebelumnya untuk memprediksi gaji seorang petugas polisi. Anda kemudian akan melihat galatnya dan memeriksa apakah distribusinya kira-kira normal. Prediksi adalah daftar nilai yang disimpan dalam preds, dan gaji aktual adalah daftar nilai yang disimpan dalam salaries.

Latihan ini adalah bagian dari kursus

Dasar-dasar Inferensi di Python

Lihat Kursus

Petunjuk latihan

  • Hitung galat sebagai gaji aktual dikurangi gaji prediksi.
  • Plot galat dalam sebuah histogram.
  • Lakukan uji kenormalan Anderson–Darling untuk galat.
  • Temukan dan cetak significance_level tempat hipotesis nol akan ditolak.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Compute the error as actual minus predicted salary
error = ____

# Plot the errors as a histogram
plt.____(____)
plt.show()

# Conduct an Anderson-Darling test using the years of experience
result = ____(____)

# Find where the result is significant
print(result.____[result.____ > result.____])
Edit dan Jalankan Kode