Gestire i punteggi dei test mancanti
Se vogliamo usare i punteggi SAT come variabile di esito, dobbiamo esaminare i valori mancanti. Analizza il pattern di missingness per tutte le variabili in nyc_scores usando miss_var_summary() del pacchetto naniar. naniar si integra con lo stile di codice Tidyverse, incluso l’operatore pipe (%>%).
Ci sono 60 punteggi mancanti in ciascuna materia. Anche se esistono molti pacchetti R che aiutano con forme più avanzate di imputazione, come MICE, Amelia e mi, continueremo a usare simputation e impute_median().
Crea un nuovo insieme di dati, nyc_scores_2, imputando il punteggio di Matematica per Borough, ma nota che impute_median() restituisce la variabile imputata con tipo "impute". Convertirai poi la variabile in numerico in un passaggio separato.
simputation e dplyr sono già caricati.
Questo esercizio fa parte del corso
Progettazione Sperimentale in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load naniar
___
# Examine missingness with miss_var_summary()
___