Maak een recept voor missende waarden
In de vorige oefeningen heb je handmatig de ratio missende waarden berekend en een filter gemaakt om de dimensionaliteit van house_sales_df te verkleinen. Het tidymodels-pakket bevat een receptstap om automatisch een ratio voor missende waarden toe te passen—step_filter_missing(). Het voordeel van de tidymodels-aanpak is dat je het recept kunt hergebruiken op andere gegevenssets en dat de overgang naar een productieomgeving eenvoudiger wordt. In deze oefening gebruik je de functie step_filter_missing() om dimensionaliteitsreductie op house_sales_df uit te voeren op basis van missende waarden.
De pakketten tidyverse en tidymodels zijn al voor je geladen.
Deze oefening maakt deel uit van de cursus
Dimensionality Reduction in R
Oefeninstructies
- Gebruik
recipe()om een filter voor missende waarden te maken met een drempel van 0.5. - Pas het
missing_vals_recipetoe ophouse_sales_df.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create missing values recipe
missing_vals_recipe <-
___(___ ~ ., data = ___) %>%
___(___(), ___ = ___) %>%
prep()
# Apply recipe to data
___ <-
___(___, ___ = ___)
# Display the first five rows of data
___ %>% ___(___)