LoslegenKostenlos loslegen

kNN Tipps & Tricks I: Spender gewichten

Eine häufig verwendete Variante der kNN-Imputation nutzt die sogenannte distanzgewichtete Aggregation. Das bedeutet: Wenn wir die Werte der Nachbarn zu einem Ersatz für einen fehlenden Wert zusammenfassen, verwenden wir den gewichteten Mittelwert, wobei die Gewichte die invertierten Distanzen zu jedem Nachbarn sind. Dadurch haben näher gelegene Nachbarn einen stärkeren Einfluss auf den imputierten Wert.

In dieser Übung wendest du die distanzgewichtete Aggregation bei der Imputation der tao-Daten an. Dazu musst du der Funktion kNN() lediglich zwei zusätzliche Argumente übergeben. Probieren wir es aus!

Diese Übung ist Teil des Kurses

Fehlende Daten mit Imputationen in R behandeln

Kurs anzeigen

Anleitung zur Übung

  • Lade das Paket VIM.
  • Imputiere humidity mit kNN und verwende den distanzgewichteten Mittelwert zur Aggregation der Nachbarn; du musst die Argumente numFun und weightDist angeben.
  • Das Margin-Plot zur Ansicht der Ergebnisse wurde bereits für dich vorbereitet.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load the VIM package
___(___)

# Impute humidity with kNN using distance-weighted mean
tao_imp <- ___(tao, 
               k = 5, 
               variable = "humidity", 
               ___ = ___,
               ___ = ___)

tao_imp %>% 
	select(sea_surface_temp, humidity, humidity_imp) %>% 
	marginplot(delimiter = "imp")
Code bearbeiten und ausführen