BaşlayınÜcretsiz Başlayın

Hataların dağılımı

Gerçek dünyadaki neredeyse hiçbir süreç mükemmel şekilde tahmin edilemez. Arzu edilen bir durum, hatanın normal dağılımlı olmasıdır. Bu, bazı gerçek değerlerin tahmininin üstünde, bazılarının ise altında kalacağı anlamına gelir. Yani hatalar (yani gerçek değerlerle tahminler arasındaki fark) sıfırın etrafında rastgele “yüzer” gibi görünür.

Bu egzersizde, bir polis memurunun maaşını tahmin eden önceden oluşturulmuş bir doğrusal modelin sonuçlarını analiz edeceksin. Ardından hatalara bakıp yaklaşık olarak normal dağılımlı olup olmadıklarını inceleyeceksin. Tahminler preds içinde saklanan bir değer listesi, gerçek maaşlar ise salaries içinde saklanan bir değer listesidir.

Bu egzersiz

Python'da Çıkarımın Temelleri

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Hataları, gerçek maaşlardan tahmin edilen maaşları çıkararak hesapla.
  • Hataları bir histogramda görselleştir.
  • Hatalar için Anderson-Darling normallik testi uygula.
  • Sıfır hipotezinin reddedileceği significance_level(leri) bul ve yazdır.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

# Compute the error as actual minus predicted salary
error = ____

# Plot the errors as a histogram
plt.____(____)
plt.show()

# Conduct an Anderson-Darling test using the years of experience
result = ____(____)

# Find where the result is significant
print(result.____[result.____ > result.____])
Kodu Düzenle ve Çalıştır