Erstelle einen Niedrigvarianz-Filter

In dieser Übung bekommst du house_sales_df mit siebzehn kontinuierlichen Merkmalen. Einige dieser Merkmale haben überhaupt keine Varianz, andere nur sehr wenig. Du untersuchst die Varianzen und legst mithilfe eines geeigneten Varianzschwellenwerts einen Filter fest. Dieser Ansatz hilft dabei, Dimensionen mit wenig bis keiner Information zu reduzieren, hat aber – wie du sehen wirst – ein paar Nachteile.

Die Pakete tidyverse und tidymodels sind bereits geladen.

Diese Übung ist Teil des Kurses

Dimensionsreduktion in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Calculate feature variances
houses_sales_variances <- ___ %>% 
  summarize(across(everything(), ~ ___(___(., ___ = ___), na.rm = ___))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "variance") %>% 
  ___(desc(___))

houses_sales_variances

Code bearbeiten und ausführen