Erstelle einen Filter für die Quote fehlender Werte
Der Data Frame house_sales_df enthält eine Zielvariable price und verschiedene Prädiktoren, die einzelne Häuser beschreiben und ihre Verkaufspreise bestimmen. Mehrere Features haben unterschiedlich viele fehlende Werte. Ist die Quote fehlender Werte zu hoch, ist das Feature bei der Vorhersage des Hauspreises wenig aussagekräftig. Solche Features können entfernt werden. In dieser Übung berechnest du für jede Spalte die Quote fehlender Werte. Das hilft dir, über einen geeigneten Schwellenwert pro Spalte nachzudenken.
Das Paket tidyverse wurde für dich geladen.
Diese Übung ist Teil des Kurses
Dimensionsreduktion in R
Anleitung zur Übung
- Speichere die Gesamtzahl der Zeilen in
house_sales_dfinn. - Berechne die Quoten fehlender Werte für jede Spalte in
house_sales_dfund speichere sie inmissing_vals_df.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate total rows
___ <- ___(___)
# Calculate missing value ratios
___ <- ___ %>%
___(___(___(), ~ ___(___(.)))) %>%
pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>%
mutate(missing_val_ratio = ___ / ___)
# Display missing value ratios
missing_vals_df