Erstelle ein Rezept für fehlende Werte
In den vorherigen Übungen hast du das Verhältnis fehlender Werte manuell berechnet und einen Filter erstellt, um die Dimensionalität von house_sales_df zu reduzieren. Das Paket tidymodels enthält einen Recipe-Step, um eine Quote fehlender Werte automatisch anzuwenden — step_filter_missing(). Die Vorteile des tidymodels-Ansatzes sind, dass du das Rezept für andere Datensätze wiederverwenden kannst und der Übergang in eine Produktionsumgebung vereinfacht wird. In dieser Übung verwendest du die Funktion step_filter_missing(), um die Dimensionsreduktion von house_sales_df auf Basis fehlender Werte durchzuführen.
Die Pakete tidyverse und tidymodels wurden bereits für dich geladen.
Diese Übung ist Teil des Kurses
Dimensionsreduktion in R
Anleitung zur Übung
- Verwende
recipe(), um einen Filter für fehlende Werte mit einem Schwellenwert von 0,5 zu erstellen. - Wende das
missing_vals_recipeaufhouse_sales_dfan.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create missing values recipe
missing_vals_recipe <-
___(___ ~ ., data = ___) %>%
___(___(), ___ = ___) %>%
prep()
# Apply recipe to data
___ <-
___(___, ___ = ___)
# Display the first five rows of data
___ %>% ___(___)