Erstelle einen Niedrigvarianz-Filter
In dieser Übung bekommst du house_sales_df mit siebzehn kontinuierlichen Merkmalen. Einige dieser Merkmale haben überhaupt keine Varianz, andere nur sehr wenig. Du untersuchst die Varianzen und legst mithilfe eines geeigneten Varianzschwellenwerts einen Filter fest. Dieser Ansatz hilft dabei, Dimensionen mit wenig bis keiner Information zu reduzieren, hat aber – wie du sehen wirst – ein paar Nachteile.
Die Pakete tidyverse und tidymodels sind bereits geladen.
Diese Übung ist Teil des Kurses
Dimensionsreduktion in R
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Calculate feature variances
houses_sales_variances <- ___ %>%
summarize(across(everything(), ~ ___(___(., ___ = ___), na.rm = ___))) %>%
pivot_longer(everything(), names_to = "feature", values_to = "variance") %>%
___(desc(___))
houses_sales_variances