Einen Filter für fehlende Werte erstellen
Der Zero-Variance-Filter entfernt nur einige der informationsarmen Features. Features können auch wenig bis keine Information enthalten, weil sie viele fehlende Werte haben. In dieser Aufgabe erstellst du einen Filter für fehlende Werte. Du gehst dabei extrem vor und entfernst jedes Feature mit mindestens einem fehlenden Wert – das kann bedeuten, dass du Features mit signifikanten Informationen entfernst.
house_sales_df steht dir in der Konsole zur Verfügung und das Paket tidyverse wurde für dich geladen.
Diese Übung ist Teil des Kurses
Dimensionsreduktion in R
Anleitung zur Übung
- Erstelle mit
summarize(),across(),sum()undis.na()einen Filter für fehlende Werte, um Features mit null oder mehr fehlenden Werten zu entfernen, und speichere ihn inna_filter.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a missing values filter
___ <- ___ %>%
___(across(everything(), ~ ___)) %>%
pivot_longer(everything(), names_to = "feature", values_to = "NA_count") %>%
___(___ > ___) %>%
pull(feature)
na_filter