Variabelegewijze imputatiefouten
In de vorige oefening heb je de geschatte imputatiefouten uit de output van missForest gehaald. Dat leverde twee getallen op:
- de genormaliseerde wortel van de gemiddelde kwadratische fout (NRMSE) voor alle continue variabelen;
- het aandeel fout geclassificeerde waarden (PFC) voor alle categorische variabelen.
Het kan echter best dat het imputatiemodel voor de ene continue variabele uitstekend presteert en voor een andere juist slecht! Om zulke gevallen te onderzoeken, kun je missForest variabelegewijze foutschattingen laten produceren. Dat doe je door het argument variablewise op TRUE te zetten.
De biopics-gegevens en de missForest-package zijn al voor je geladen, dus laten we de fouten eens van dichterbij bekijken!
Deze oefening maakt deel uit van de cursus
Omgaan met missende data met imputaties in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Impute biopics data with missForest computing per-variable errors
imp_res <- ___(___, ___ = ___)