Sınıflandırma değerlendirmesi
Önceki derste, Parkinson hastalığını tahmin etmek için lojistik bir model kurmuştun. Bu egzersizde, tahminleri gerçek değerlerle karşılaştıracaksın.
Bu beceri çok önemli çünkü şirketler sonuçlara odaklanır. İşverenler, geliştirdiğin modellerin ne kadar doğru olduğunu bilmek ister.
Yine Parkinson hastalığının durumunu tahmin eden bir model kuracaksın. Bu kez, modelin bir kısmını veri kümesinin bir bölümünde kuracak ve kalanıyla test edeceksin.
Unutma: \(\text{recall} = \frac{TP}{TP+FN}\).
\(TP\), pozitif bir değer tahmin ettiğimiz ve doğru olduğumuz anlamına gelir.
\(FN\), negatif bir değer tahmin ettiğimiz ama yanlış olduğumuz anlamına gelir.
parkinsons veri kümesinin satırlarının yaklaşık %80'i traine, geri kalanı ise teste atanmıştır.
Bu egzersiz
R ile İstatistik Mülakat Soruları Pratiği
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Build a logistic model on the train data
model <- ___(___ ~ NHR + ___, data = ___, family = ___)
# Calculate probabilities for the test data
probabilities <- ___(___, newdata = ___, type = ___)