Logistische modellen fitten
Veel bedrijfsvraagstukken vragen om het voorspellen van een binaire responsvariabele. Je toekomstige werkgever wil misschien spam-e-mails, creditcardfraude of zeldzame ziekten detecteren.
Het logistische regressiemodel is de standaardmethode voor binaire classificatieproblemen.
In deze oefening gebruik je de Parkinsons-gegevensset uit de UCI-repository. Deze gegevensset bestaat uit diverse biomedische stemmetingen van mensen met en zonder de ziekte van Parkinson.
Je gebruikt de volgende variabelen uit de gegevensset:
status- 1 - als iemand de ziekte van Parkinson heeft, 0 - anders,NHR- een maat voor de verhouding tussen ruis- en tooncomponenten in de stem,DFA- een fractale schaalexponent van het signaal.
De gegevensset is beschikbaar als parkinsons.
Deze oefening maakt deel uit van de cursus
Oefenen met statistiek-vragen voor sollicitaties in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Plot status vs NHR
___(status ~ ___, data = ___)
# Plot status vs DFA
___(___ ~ ___, ___ = ___)