Maak een filter voor ontbrekende waarden
De nul-variantie-filter verwijdert alleen sommige van de weinig-informatieve features. Features kunnen ook weinig tot geen informatie bevatten omdat ze veel ontbrekende waarden hebben. In deze oefening maak je een filter voor ontbrekende waarden. Je kiest een extreme aanpak en verwijdert elke feature met minstens één ontbrekende waarde, wat betekent dat je features met veel informatie zou kunnen verwijderen.
house_sales_df is beschikbaar in de console en het tidyverse-pakket is voor je geladen.
Deze oefening maakt deel uit van de cursus
Dimensionality Reduction in R
Oefeninstructies
- Maak een filter voor ontbrekende waarden met
summarize(),across(),sum()enis.na()om features te verwijderen met nul of meer ontbrekende waarden, en sla dit op inna_filter.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create a missing values filter
___ <- ___ %>%
___(across(everything(), ~ ___)) %>%
pivot_longer(everything(), names_to = "feature", values_to = "NA_count") %>%
___(___ > ___) %>%
pull(feature)
na_filter