Aan de slagGa gratis aan de slag

Standaardmodellen kiezen

MICE maakt een apart imputatiemodel voor elke variabele in de data. Welk type model dat is, hangt af van het type van de betreffende variabele. Een populaire manier om aan te geven welke modellen we willen gebruiken, is om een standaardmodel in te stellen voor elk van de vier variabeltypen.

Dit kun je doen door het argument defaultMethod aan mice() door te geven. Dat moet een vector van lengte 4 zijn met de standaardimputatiemethoden voor:

  1. Continue variabelen,
  2. Binaire variabelen,
  3. Categorische variabelen (ongeordende factoren),
  4. Factorvariabelen (geordende factoren).

In deze oefening maak je gebruik van de documentatie van mice om de lijst met beschikbare methoden te bekijken en de gewenste te kiezen voor het algoritme. Aan de slag met modelselectie!

Deze oefening maakt deel uit van de cursus

Omgaan met missende data met imputaties in R

Cursus bekijken

Oefeninstructies

  • In de RDocumentation die je krijgt met ?mice staat een tabel met het trefwoord voor elke methode.
  • Imputeer de biopics-data met mice() met de volgende standaardmethoden, in deze volgorde: classificatie- en regressiebomen, lineaire discriminantanalyse, predictive mean matching, proportioneel odds-model.
  • Print biopics_multiimp om te zien welke methode voor welke variabele is gebruikt.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Impute biopics using the methods specified in the instruction
biopics_multiimp <- ___(biopics, m = 20, 
                         defaultMethod = ___)

# Print biopics_multiimp
print(biopics_multiimp)
Code bewerken en uitvoeren