Sınıflandırma değerlendirmesi
Önceki derste, Parkinson hastalığını tahmin etmek için lojistik bir model kurmuştun. Bu egzersizde, tahminleri gerçek değerlerle karşılaştıracaksın.
Bu beceri çok önemli çünkü şirketler sonuçlara odaklanır. İşverenler, geliştirdiğin modellerin ne kadar doğru olduğunu bilmek ister.
Yine Parkinson hastalığının durumunu tahmin eden bir model kuracaksın. Bu kez, modelin bir kısmını veri kümesinin bir bölümünde kuracak ve kalanıyla test edeceksin.
Unutma: \(\text{recall} = \frac{TP}{TP+FN}\).
\(TP\), pozitif bir değer tahmin ettiğimiz ve doğru olduğumuz anlamına gelir.
\(FN\), negatif bir değer tahmin ettiğimiz ama yanlış olduğumuz anlamına gelir.
parkinsons veri kümesinin satırlarının yaklaşık %80'i traine, geri kalanı ise teste atanmıştır.
Bu egzersiz, kursun bir parçasıdır
R ile İstatistik Mülakat Soruları Pratiği
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Build a logistic model on the train data
model <- ___(___ ~ NHR + ___, data = ___, family = ___)
# Calculate probabilities for the test data
probabilities <- ___(___, newdata = ___, type = ___)