Crea una recipe per i valori mancanti
Negli esercizi precedenti, hai calcolato manualmente il rapporto di valori mancanti e creato un filtro per ridurre la dimensionalità di house_sales_df. Il pacchetto tidymodels include uno step della recipe per applicare automaticamente un rapporto di valori mancanti—step_filter_missing(). I vantaggi dell’approccio tidymodels sono che ti permette di riutilizzare la recipe su altri insiemi di dati e semplifica il passaggio a un ambiente di produzione. In questo esercizio userai la funzione step_filter_missing() per effettuare la riduzione della dimensionalità di house_sales_df in base ai valori mancanti.
I pacchetti tidyverse e tidymodels sono già stati caricati per te.
Questo esercizio fa parte del corso
Riduzione della dimensionalità in R
Istruzioni dell'esercizio
- Usa
recipe()per creare un filtro dei valori mancanti con una soglia di 0.5. - Applica
missing_vals_recipeahouse_sales_df.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create missing values recipe
missing_vals_recipe <-
___(___ ~ ., data = ___) %>%
___(___(), ___ = ___) %>%
prep()
# Apply recipe to data
___ <-
___(___, ___ = ___)
# Display the first five rows of data
___ %>% ___(___)