Variablenweise Imputationsfehler
In der vorherigen Übung hast du die geschätzten Imputationsfehler aus der Ausgabe von missForest extrahiert. Das ergab zwei Kennzahlen:
- den normalisierten Root Mean Squared Error (NRMSE) für alle kontinuierlichen Variablen;
- den Anteil falsch klassifizierter Einträge (PFC) für alle kategorialen Variablen.
Es kann aber gut sein, dass das Imputationsmodell für eine kontinuierliche Variable sehr gut und für eine andere deutlich schlechter abschneidet! Um solche Fälle zu diagnostizieren, kannst du missForest anweisen, variablenweise Fehlerschätzungen zu berechnen. Das erreichst du, indem du das Argument variablewise auf TRUE setzt.
Die biopics-Daten und das Paket missForest sind bereits geladen. Schauen wir uns die Fehler genauer an!
Diese Übung ist Teil des Kurses
Fehlende Daten mit Imputationen in R behandeln
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Impute biopics data with missForest computing per-variable errors
imp_res <- ___(___, ___ = ___)