LoslegenKostenlos loslegen

Erstelle einen Filter für die Quote fehlender Werte

Der Data Frame house_sales_df enthält eine Zielvariable price und verschiedene Prädiktoren, die einzelne Häuser beschreiben und ihre Verkaufspreise bestimmen. Mehrere Features haben unterschiedlich viele fehlende Werte. Ist die Quote fehlender Werte zu hoch, ist das Feature bei der Vorhersage des Hauspreises wenig aussagekräftig. Solche Features können entfernt werden. In dieser Übung berechnest du für jede Spalte die Quote fehlender Werte. Das hilft dir, über einen geeigneten Schwellenwert pro Spalte nachzudenken.

Das Paket tidyverse wurde für dich geladen.

Diese Übung ist Teil des Kurses

Dimensionsreduktion in R

Kurs anzeigen

Anleitung zur Übung

  • Speichere die Gesamtzahl der Zeilen in house_sales_df in n.
  • Berechne die Quoten fehlender Werte für jede Spalte in house_sales_df und speichere sie in missing_vals_df.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Calculate total rows
___ <-  ___(___)

# Calculate missing value ratios
___ <- ___ %>% 
  ___(___(___(), ~ ___(___(.)))) %>% 
  pivot_longer(everything(), names_to = "feature", values_to = "num_missing_values") %>% 
  mutate(missing_val_ratio = ___ / ___)

# Display missing value ratios
missing_vals_df
Code bearbeiten und ausführen