LoslegenKostenlos starten

Variablenweise Imputationsfehler

In der vorherigen Übung hast du die geschätzten Imputationsfehler aus der Ausgabe von missForest extrahiert. Das ergab zwei Kennzahlen:

  • den normalisierten Root Mean Squared Error (NRMSE) für alle kontinuierlichen Variablen;
  • den Anteil falsch klassifizierter Einträge (PFC) für alle kategorialen Variablen.

Es kann aber gut sein, dass das Imputationsmodell für eine kontinuierliche Variable sehr gut und für eine andere deutlich schlechter abschneidet! Um solche Fälle zu diagnostizieren, kannst du missForest anweisen, variablenweise Fehlerschätzungen zu berechnen. Das erreichst du, indem du das Argument variablewise auf TRUE setzt.

Die biopics-Daten und das Paket missForest sind bereits geladen. Schauen wir uns die Fehler genauer an!

Diese Übung ist Teil des Kurses

<Kurs>Fehlende Daten mit Imputationen in R behandeln</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Impute biopics data with missForest computing per-variable errors
imp_res <- ___(___, ___ = ___)
Code bearbeiten und ausführen