LoslegenKostenlos loslegen

Einen Filter für fehlende Werte erstellen

Der Zero-Variance-Filter entfernt nur einige der informationsarmen Features. Features können auch wenig bis keine Information enthalten, weil sie viele fehlende Werte haben. In dieser Aufgabe erstellst du einen Filter für fehlende Werte. Du gehst dabei extrem vor und entfernst jedes Feature mit mindestens einem fehlenden Wert – das kann bedeuten, dass du Features mit signifikanten Informationen entfernst.

house_sales_df steht dir in der Konsole zur Verfügung und das Paket tidyverse wurde für dich geladen.

Diese Übung ist Teil des Kurses

Dimensionsreduktion in R

Kurs anzeigen

Anleitung zur Übung

  • Erstelle mit summarize(), across(), sum() und is.na() einen Filter für fehlende Werte, um Features mit null oder mehr fehlenden Werten zu entfernen, und speichere ihn in na_filter.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a missing values filter
___ <- ___ %>% 
  ___(across(everything(), ~ ___)) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "NA_count") %>% 
  ___(___ > ___) %>% 
  pull(feature)
  
na_filter
Code bearbeiten und ausführen