LoslegenKostenlos starten

Erstelle einen Filter für die Quote fehlender Werte

Der Data Frame house_sales_df enthält eine Zielvariable price und verschiedene Prädiktoren, die einzelne Häuser beschreiben und ihre Verkaufspreise bestimmen. Mehrere Features haben unterschiedlich viele fehlende Werte. Ist die Quote fehlender Werte zu hoch, ist das Feature bei der Vorhersage des Hauspreises wenig aussagekräftig. Solche Features können entfernt werden. In dieser Übung berechnest du für jede Spalte die Quote fehlender Werte. Das hilft dir, über einen geeigneten Schwellenwert pro Spalte nachzudenken.

Das Paket tidyverse wurde für dich geladen.

Diese Übung ist Teil des Kurses

<Kurs>Dimensionsreduktion in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Speichere die Gesamtzahl der Zeilen in house_sales_df in n.
  • Berechne die Quoten fehlender Werte für jede Spalte in house_sales_df und speichere sie in missing_vals_df.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Calculate total rows
___ <-  ___(___)

# Calculate missing value ratios
___ <- ___ %>% 
  ___(___(___(), ~ ___(___(.)))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>% 
  mutate(missing_val_ratio = ___ / ___)

# Display missing value ratios
missing_vals_df
Code bearbeiten und ausführen