Erstelle einen Niedrigvarianz-Filter
In dieser Übung bekommst du house_sales_df mit siebzehn kontinuierlichen Merkmalen. Einige dieser Merkmale haben überhaupt keine Varianz, andere nur sehr wenig. Du untersuchst die Varianzen und legst mithilfe eines geeigneten Varianzschwellenwerts einen Filter fest. Dieser Ansatz hilft dabei, Dimensionen mit wenig bis keiner Information zu reduzieren, hat aber – wie du sehen wirst – ein paar Nachteile.
Die Pakete tidyverse und tidymodels sind bereits geladen.
Diese Übung ist Teil des Kurses
<Kurs>Dimensionsreduktion in R</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Calculate feature variances
houses_sales_variances <- ___ %>%
summarize(across(everything(), ~ ___(___(., ___ = ___), na.rm = ___))) %>%
pivot_longer(everything(), names_to = "feature", values_to = "variance") %>%
___(desc(___))
houses_sales_variances