Aan de slagGa gratis aan de slag

Logistische modellen fitten

Veel bedrijfsvraagstukken vragen om het voorspellen van een binaire responsvariabele. Je toekomstige werkgever wil misschien spam-e-mails, creditcardfraude of zeldzame ziekten detecteren.

Het logistische regressiemodel is de standaardmethode voor binaire classificatieproblemen.

In deze oefening gebruik je de Parkinsons-gegevensset uit de UCI-repository. Deze gegevensset bestaat uit diverse biomedische stemmetingen van mensen met en zonder de ziekte van Parkinson.

Je gebruikt de volgende variabelen uit de gegevensset:

  • status - 1 - als iemand de ziekte van Parkinson heeft, 0 - anders,
  • NHR - een maat voor de verhouding tussen ruis- en tooncomponenten in de stem,
  • DFA - een fractale schaalexponent van het signaal.

De gegevensset is beschikbaar als parkinsons.

Deze oefening maakt deel uit van de cursus

Oefenen met statistiek-vragen voor sollicitaties in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Plot status vs NHR
___(status ~ ___, data = ___)

# Plot status vs DFA
___(___ ~ ___, ___ = ___)
Code bewerken en uitvoeren