Logistische Modelle anpassen
Viele Business-Probleme erfordern die Vorhersage einer binären Zielvariable. Dein zukünftiger Arbeitgeber muss vielleicht Spam-E-Mails, Kreditkartenbetrug oder seltene Krankheiten erkennen.
Das logistische Regressionsmodell ist die Standardmethode für binäre Klassifikationsprobleme.
In dieser Übung verwendest du den Parkinson-Datensatz aus dem UCI-Repository. Dieser Datensatz besteht aus verschiedenen biomedizinischen Stimm-Messungen von Personen mit und ohne Parkinson-Erkrankung.
Du verwendest folgende Variablen aus dem Datensatz:
status– 1, wenn eine Person an Parkinson erkrankt ist, sonst 0,NHR– ein Maß für das Verhältnis von Rausch- zu tonalen Komponenten in der Stimme,DFA– ein fraktaler Skalierungs-Exponenten des Signals.
Der Datensatz ist als parkinsons verfügbar.
Diese Übung ist Teil des Kurses
Statistik-Interviewfragen in R üben
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Plot status vs NHR
___(status ~ ___, data = ___)
# Plot status vs DFA
___(___ ~ ___, ___ = ___)