CommencerCommencer gratuitement

Gérer les notes de test manquantes

Si nous voulons utiliser les scores SAT comme variable de résultat, il faut examiner les valeurs manquantes. Analysez le schéma des valeurs manquantes pour toutes les variables de nyc_scores avec miss_var_summary() du package naniar. naniar s’intègre au style de code Tidyverse, y compris l’opérateur pipe (%>%).

Il manque 60 scores dans chaque matière. Bien qu’il existe de nombreux packages R pour des méthodes d’imputation plus avancées, comme MICE, Amelia et mi, nous allons continuer d’utiliser simputation et impute_median().

Créez un nouveau jeu de données, nyc_scores_2, en imputant la note de Math par arrondissement (Borough). Notez toutefois que impute_median() renvoie la variable imputée avec le type "impute". Vous convertirez ensuite la variable en numérique dans une étape séparée.

simputation et dplyr sont chargés.

Cet exercice fait partie du cours

Plan d’expériences en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Load naniar
___

# Examine missingness with miss_var_summary()
___
Modifier et exécuter le code