Aan de slagGa gratis aan de slag

Maak een recept voor missende waarden

In de vorige oefeningen heb je handmatig de ratio missende waarden berekend en een filter gemaakt om de dimensionaliteit van house_sales_df te verkleinen. Het tidymodels-pakket bevat een receptstap om automatisch een ratio voor missende waarden toe te passen—step_filter_missing(). Het voordeel van de tidymodels-aanpak is dat je het recept kunt hergebruiken op andere gegevenssets en dat de overgang naar een productieomgeving eenvoudiger wordt. In deze oefening gebruik je de functie step_filter_missing() om dimensionaliteitsreductie op house_sales_df uit te voeren op basis van missende waarden.

De pakketten tidyverse en tidymodels zijn al voor je geladen.

Deze oefening maakt deel uit van de cursus

Dimensionality Reduction in R

Cursus bekijken

Oefeninstructies

  • Gebruik recipe() om een filter voor missende waarden te maken met een drempel van 0.5.
  • Pas het missing_vals_recipe toe op house_sales_df.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create missing values recipe
missing_vals_recipe <- 
  ___(___ ~ ., data = ___) %>% 
  ___(___(), ___ = ___) %>% 
  prep()
  
# Apply recipe to data
___ <- 
  ___(___, ___ = ___)

# Display the first five rows of data
___ %>% ___(___)
Code bewerken en uitvoeren