IniziaInizia gratis

Gestire i punteggi dei test mancanti

Se vogliamo usare i punteggi SAT come variabile di esito, dobbiamo esaminare i valori mancanti. Analizza il pattern di missingness per tutte le variabili in nyc_scores usando miss_var_summary() del pacchetto naniar. naniar si integra con lo stile di codice Tidyverse, incluso l’operatore pipe (%>%).

Ci sono 60 punteggi mancanti in ciascuna materia. Anche se esistono molti pacchetti R che aiutano con forme più avanzate di imputazione, come MICE, Amelia e mi, continueremo a usare simputation e impute_median().

Crea un nuovo insieme di dati, nyc_scores_2, imputando il punteggio di Matematica per Borough, ma nota che impute_median() restituisce la variabile imputata con tipo "impute". Convertirai poi la variabile in numerico in un passaggio separato.

simputation e dplyr sono già caricati.

Questo esercizio fa parte del corso

Progettazione Sperimentale in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load naniar
___

# Examine missingness with miss_var_summary()
___
Modifica ed esegui il codice