IniziaInizia gratis

Crea un filtro per il rapporto di valori mancanti

Il data frame house_sales_df contiene una variabile target price e una varietà di predittori che descrivono le singole case e ne determinano il prezzo di vendita. Diverse feature hanno un numero variabile di valori mancanti. Se il rapporto di valori mancanti è troppo alto, la feature non sarà molto informativa per prevedere il prezzo della casa. Queste feature possono essere rimosse. In questo esercizio calcolerai il rapporto di valori mancanti per ogni colonna. Questo ti aiuterà a pensare a una soglia appropriata per ciascuna colonna.

Il pacchetto tidyverse è già stato caricato per te.

Questo esercizio fa parte del corso

Riduzione della dimensionalità in R

Visualizza il corso

Istruzioni dell'esercizio

  • Salva il numero totale di righe di house_sales_df in n.
  • Calcola i rapporti di valori mancanti per ogni colonna in house_sales_df e salvali in missing_vals_df.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Calculate total rows
___ <-  ___(___)

# Calculate missing value ratios
___ <- ___ %>% 
  ___(___(___(), ~ ___(___(.)))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>% 
  mutate(missing_val_ratio = ___ / ___)

# Display missing value ratios
missing_vals_df
Modifica ed esegui il codice