LoslegenKostenlos starten

Erstelle einen Niedrigvarianz-Filter

In dieser Übung bekommst du house_sales_df mit siebzehn kontinuierlichen Merkmalen. Einige dieser Merkmale haben überhaupt keine Varianz, andere nur sehr wenig. Du untersuchst die Varianzen und legst mithilfe eines geeigneten Varianzschwellenwerts einen Filter fest. Dieser Ansatz hilft dabei, Dimensionen mit wenig bis keiner Information zu reduzieren, hat aber – wie du sehen wirst – ein paar Nachteile.

Die Pakete tidyverse und tidymodels sind bereits geladen.

Diese Übung ist Teil des Kurses

<Kurs>Dimensionsreduktion in R</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Calculate feature variances
houses_sales_variances <- ___ %>% 
  summarize(across(everything(), ~ ___(___(., ___ = ___), na.rm = ___))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "variance") %>% 
  ___(desc(___))

houses_sales_variances
Code bearbeiten und ausführen