LoslegenKostenlos loslegen

Standardmodelle auswählen

MICE erstellt für jede Variable im Datensatz ein eigenes Imputationsmodell. Welche Art von Modell das ist, hängt vom Typ der jeweiligen Variable ab. Eine gängige Möglichkeit, die gewünschten Modellarten festzulegen, ist, für jeden der vier Variablentypen ein Standardmodell zu setzen.

Das machst du, indem du das Argument defaultMethod an mice() übergibst. Es sollte ein Vektor der Länge 4 sein und die Standard-Imputationsmethoden für folgende Typen enthalten:

  1. Stetige Variablen,
  2. Binäre Variablen,
  3. Kategoriale Variablen (ungeordnete Faktoren),
  4. Faktorenvariablen (geordnete Faktoren).

In dieser Übung nutzt du die Dokumentation von mice, um die Liste der verfügbaren Methoden anzusehen und die gewünschten für den Algorithmus auszuwählen. Lass uns Modellwahl betreiben!

Diese Übung ist Teil des Kurses

Fehlende Daten mit Imputationen in R behandeln

Kurs anzeigen

Anleitung zur Übung

  • In der RDocumentation, die ?mice zurückgibt, gibt es eine Tabelle mit dem Schlüsselwort für jede Methode.
  • Imputiere die biopics-Daten mit mice() unter Verwendung der folgenden Standardmethoden, in dieser Reihenfolge: Classification and Regression Trees, Linear Discriminant Analysis, Predictive Mean Matching, Proportional Odds Model.
  • Gib biopics_multiimp aus, um zu sehen, welche Methode für welche Variable verwendet wurde.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Impute biopics using the methods specified in the instruction
biopics_multiimp <- ___(biopics, m = 20, 
                         defaultMethod = ___)

# Print biopics_multiimp
print(biopics_multiimp)
Code bearbeiten und ausführen