Umgang mit fehlenden Testergebnissen
Wenn wir SAT-Ergebnisse als Outcome verwenden wollen, sollten wir die Missingness untersuchen. Untersuche das Muster der fehlenden Werte über alle Variablen in nyc_scores mit miss_var_summary() aus dem Paket naniar. naniar integriert sich in den Tidyverse-Stil, einschließlich des Pipe-Operators (%>%).
Es fehlen 60 Ergebnisse pro Fach. Es gibt zwar viele R-Pakete für fortgeschrittenere Imputation, wie MICE, Amelia und mi, aber wir verwenden weiterhin simputation und impute_median().
Erstelle einen neuen Datensatz nyc_scores_2, indem du den Math-Score nach Borough imputierst. Beachte jedoch, dass impute_median() die imputierte Variable als Typ "impute" zurückgibt. Du wandelst die Variable in einem separaten Schritt in numerisch um.
simputation und dplyr sind geladen.
Diese Übung ist Teil des Kurses
<Kurs>Versuchsplanung in R</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Load naniar
___
# Examine missingness with miss_var_summary()
___