LoslegenKostenlos starten

Umgang mit fehlenden Testergebnissen

Wenn wir SAT-Ergebnisse als Outcome verwenden wollen, sollten wir die Missingness untersuchen. Untersuche das Muster der fehlenden Werte über alle Variablen in nyc_scores mit miss_var_summary() aus dem Paket naniar. naniar integriert sich in den Tidyverse-Stil, einschließlich des Pipe-Operators (%>%).

Es fehlen 60 Ergebnisse pro Fach. Es gibt zwar viele R-Pakete für fortgeschrittenere Imputation, wie MICE, Amelia und mi, aber wir verwenden weiterhin simputation und impute_median().

Erstelle einen neuen Datensatz nyc_scores_2, indem du den Math-Score nach Borough imputierst. Beachte jedoch, dass impute_median() die imputierte Variable als Typ "impute" zurückgibt. Du wandelst die Variable in einem separaten Schritt in numerisch um.

simputation und dplyr sind geladen.

Diese Übung ist Teil des Kurses

<Kurs>Versuchsplanung in R</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Load naniar
___

# Examine missingness with miss_var_summary()
___
Code bearbeiten und ausführen