Crea un filtro per il rapporto di valori mancanti
Il data frame house_sales_df contiene una variabile target price e una varietà di predittori che descrivono le singole case e ne determinano il prezzo di vendita. Diverse feature hanno un numero variabile di valori mancanti. Se il rapporto di valori mancanti è troppo alto, la feature non sarà molto informativa per prevedere il prezzo della casa. Queste feature possono essere rimosse. In questo esercizio calcolerai il rapporto di valori mancanti per ogni colonna. Questo ti aiuterà a pensare a una soglia appropriata per ciascuna colonna.
Il pacchetto tidyverse è già stato caricato per te.
Questo esercizio fa parte del corso
Riduzione della dimensionalità in R
Istruzioni dell'esercizio
- Salva il numero totale di righe di
house_sales_dfinn. - Calcola i rapporti di valori mancanti per ogni colonna in
house_sales_dfe salvali inmissing_vals_df.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Calculate total rows
___ <- ___(___)
# Calculate missing value ratios
___ <- ___ %>%
___(___(___(), ~ ___(___(.)))) %>%
pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>%
mutate(missing_val_ratio = ___ / ___)
# Display missing value ratios
missing_vals_df