MICE-imputatie
Het fancyimpute-pakket biedt verschillende robuuste Machine Learning-modellen voor het imputeren van missende waarden. Je kunt de volledige lijst met imputers bekijken in de gedetailleerde documentatie. Hier gebruiken we IterativeImputer, ook wel bekend als MICE, om ontbrekende waarden te imputeren.
De IterativeImputer voert meerdere regressies uit op willekeurige steekproeven van de data en aggregeert de resultaten om de missende waarden te imputeren. Je gebruikt de diabetes-DataFrame om deze imputatie uit te voeren.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in Python
Oefeninstructies
- Importeer
IterativeImputeruitfancyimpute. - Kopieer
diabetesnaardiabetes_mice_imputed. - Maak een
IterativeImputer()-object en ken dit toe aanmice_imputer. - Imputeer de
diabetes_mice_imputedDataFrame.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import IterativeImputer from fancyimpute
___
# Copy diabetes to diabetes_mice_imputed
diabetes_mice_imputed = ___
# Initialize IterativeImputer
mice_imputer = ___
# Impute using fit_tranform on diabetes_mice_imputed
diabetes_mice_imputed.iloc[:, :] = ___