LoslegenKostenlos starten

Einen Filter für fehlende Werte erstellen

Der Zero-Variance-Filter entfernt nur einige der informationsarmen Features. Features können auch wenig bis keine Information enthalten, weil sie viele fehlende Werte haben. In dieser Aufgabe erstellst du einen Filter für fehlende Werte. Du gehst dabei extrem vor und entfernst jedes Feature mit mindestens einem fehlenden Wert – das kann bedeuten, dass du Features mit signifikanten Informationen entfernst.

house_sales_df steht dir in der Konsole zur Verfügung und das Paket tidyverse wurde für dich geladen.

Diese Übung ist Teil des Kurses

<Kurs>Dimensionsreduktion in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle mit summarize(), across(), sum() und is.na() einen Filter für fehlende Werte, um Features mit null oder mehr fehlenden Werten zu entfernen, und speichere ihn in na_filter.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create a missing values filter
___ <- ___ %>% 
  ___(across(everything(), ~ ___)) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "NA_count") %>% 
  ___(___ > ___) %>% 
  pull(feature)
  
na_filter
Code bearbeiten und ausführen