Evaluierung von Klassifikationen
In der vorherigen Lektion hast du ein logistisches Modell zur Vorhersage von Parkinson erstellt. In dieser Übung vergleichst du Vorhersagen mit tatsächlichen Werten.
Diese Fähigkeit ist entscheidend, weil Unternehmen auf Ergebnisse schauen. Arbeitgebende wollen wissen, wie genau die Modelle sind, die du entwickelst.
Du baust erneut ein Modell, das den Status von Parkinson vorhersagt. Diesmal trainierst du das Modell auf einem Teil des Datensatzes und verwendest den Rest zum Testen.
Denk daran: \(\text{recall} = \frac{TP}{TP+FN}\).
\(TP\) bedeutet, dass wir einen positiven Wert vorhergesagt haben und richtig lagen.
\(FN\) bedeutet, dass wir einen negativen Wert vorhergesagt haben, aber falsch lagen.
Rund 80 % der Zeilen des parkinsons-Datensatzes wurden train zugewiesen, der Rest test.
Diese Übung ist Teil des Kurses
Statistik-Interviewfragen in R üben
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Build a logistic model on the train data
model <- ___(___ ~ NHR + ___, data = ___, family = ___)
# Calculate probabilities for the test data
probabilities <- ___(___, newdata = ___, type = ___)