Aan de slagGa gratis aan de slag

Een predictormatrix gebruiken

Een belangrijke keuze bij modelgebaseerde imputatie is welke variabelen je als voorspellers opneemt, en in welke modellen. In mice() wordt dit geregeld door de predictormatrix en standaard worden alle variabelen gebruikt om alle andere te imputeren.

Als je veel variabelen hebt of weinig tijd om een goede modelselectie te doen, kun je de functionaliteit van mice gebruiken om een predictormatrix te maken op basis van de correlaties tussen de variabelen. Deze matrix kun je vervolgens doorgeven aan mice(). In deze oefening ga je precies dat doen: je bouwt eerst een predictormatrix zodat elke variabele wordt geïmmputeerd met de variabelen die er het sterkst mee samenhangen; daarna geef je je predictormatrix mee aan de imputatiefunctie. Laten we deze eenvoudige modelselectie proberen!

Deze oefening maakt deel uit van de cursus

Omgaan met missende data met imputaties in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create predictor matrix with minimum correlation of 0.1
pred_mat <- ___(biopics, mincor = ___)
Code bewerken en uitvoeren