Aan de slagGa gratis aan de slag

Evaluatie van classificatie

In de vorige les heb je een logistiek model gebouwd om de ziekte van Parkinson te voorspellen. In deze oefening ga je voorspellingen vergelijken met werkelijke waarden.

Deze vaardigheid is belangrijk, omdat bedrijven vooral naar de resultaten kijken. Werkgevers willen weten hoe nauwkeurig de modellen zijn die je ontwikkelt.

Je bouwt opnieuw een model om de status van de ziekte van Parkinson te voorspellen. Deze keer bouw je het model op een deel van de gegevensset en gebruik je de rest om te testen.

Onthoud dat \(\text{recall} = \frac{TP}{TP+FN}\).

\(TP\) betekent dat we een positieve waarde hebben voorspeld en dat dit klopte.

\(FN\) betekent dat we een negatieve waarde hebben voorspeld maar dat dit onjuist was.

Ongeveer 80% van de rijen van de gegevensset parkinsons is toegewezen aan train, en de rest aan test.

Deze oefening maakt deel uit van de cursus

Oefenen met statistiek-vragen voor sollicitaties in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Build a logistic model on the train data
model <- ___(___ ~ NHR + ___, data = ___, family = ___)

# Calculate probabilities for the test data
probabilities <- ___(___, newdata = ___, type = ___)
Code bewerken en uitvoeren