LoslegenKostenlos starten

kNN Tipps & Tricks I: Spender gewichten

Eine häufig verwendete Variante der kNN-Imputation nutzt die sogenannte distanzgewichtete Aggregation. Das bedeutet: Wenn wir die Werte der Nachbarn zu einem Ersatz für einen fehlenden Wert zusammenfassen, verwenden wir den gewichteten Mittelwert, wobei die Gewichte die invertierten Distanzen zu jedem Nachbarn sind. Dadurch haben näher gelegene Nachbarn einen stärkeren Einfluss auf den imputierten Wert.

In dieser Übung wendest du die distanzgewichtete Aggregation bei der Imputation der tao-Daten an. Dazu musst du der Funktion kNN() lediglich zwei zusätzliche Argumente übergeben. Probieren wir es aus!

Diese Übung ist Teil des Kurses

<Kurs>Fehlende Daten mit Imputationen in R behandeln</Kurs>
Kurs ansehen

Übungsanweisungen

  • Lade das Paket VIM.
  • Imputiere humidity mit kNN und verwende den distanzgewichteten Mittelwert zur Aggregation der Nachbarn; du musst die Argumente numFun und weightDist angeben.
  • Das Margin-Plot zur Ansicht der Ergebnisse wurde bereits für dich vorbereitet.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Load the VIM package
___(___)

# Impute humidity with kNN using distance-weighted mean
tao_imp <- ___(tao, 
               k = 5, 
               variable = "humidity", 
               ___ = ___,
               ___ = ___)

tao_imp %>% 
	select(sea_surface_temp, humidity, humidity_imp) %>% 
	marginplot(delimiter = "imp")
Code bearbeiten und ausführen