Aan de slagGa gratis aan de slag

Maak een filter voor ontbrekende waarden

De nul-variantie-filter verwijdert alleen sommige van de weinig-informatieve features. Features kunnen ook weinig tot geen informatie bevatten omdat ze veel ontbrekende waarden hebben. In deze oefening maak je een filter voor ontbrekende waarden. Je kiest een extreme aanpak en verwijdert elke feature met minstens één ontbrekende waarde, wat betekent dat je features met veel informatie zou kunnen verwijderen.

house_sales_df is beschikbaar in de console en het tidyverse-pakket is voor je geladen.

Deze oefening maakt deel uit van de cursus

Dimensionality Reduction in R

Cursus bekijken

Oefeninstructies

  • Maak een filter voor ontbrekende waarden met summarize(), across(), sum() en is.na() om features te verwijderen met nul of meer ontbrekende waarden, en sla dit op in na_filter.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create a missing values filter
___ <- ___ %>% 
  ___(across(everything(), ~ ___)) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "NA_count") %>% 
  ___(___ > ___) %>% 
  pull(feature)
  
na_filter
Code bewerken en uitvoeren