BaşlayınÜcretsiz başlayın

Hataların dağılımı

Gerçek dünyadaki neredeyse hiçbir süreç mükemmel şekilde tahmin edilemez. Arzu edilen bir durum, hatanın normal dağılımlı olmasıdır. Bu, bazı gerçek değerlerin tahmininin üstünde, bazılarının ise altında kalacağı anlamına gelir. Yani hatalar (yani gerçek değerlerle tahminler arasındaki fark) sıfırın etrafında rastgele “yüzer” gibi görünür.

Bu egzersizde, bir polis memurunun maaşını tahmin eden önceden oluşturulmuş bir doğrusal modelin sonuçlarını analiz edeceksin. Ardından hatalara bakıp yaklaşık olarak normal dağılımlı olup olmadıklarını inceleyeceksin. Tahminler preds içinde saklanan bir değer listesi, gerçek maaşlar ise salaries içinde saklanan bir değer listesidir.

Bu egzersiz, kursun bir parçasıdır

Python'da Çıkarımın Temelleri

Kursa Göz Atın

Egzersiz talimatları

  • Hataları, gerçek maaşlardan tahmin edilen maaşları çıkararak hesapla.
  • Hataları bir histogramda görselleştir.
  • Hatalar için Anderson-Darling normallik testi uygula.
  • Sıfır hipotezinin reddedileceği significance_level(leri) bul ve yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Compute the error as actual minus predicted salary
error = ____

# Plot the errors as a histogram
plt.____(____)
plt.show()

# Conduct an Anderson-Darling test using the years of experience
result = ____(____)

# Find where the result is significant
print(result.____[result.____ > result.____])
Kodu Düzenle ve Çalıştır