kNN Tipps & Tricks I: Spender gewichten
Eine häufig verwendete Variante der kNN-Imputation nutzt die sogenannte distanzgewichtete Aggregation. Das bedeutet: Wenn wir die Werte der Nachbarn zu einem Ersatz für einen fehlenden Wert zusammenfassen, verwenden wir den gewichteten Mittelwert, wobei die Gewichte die invertierten Distanzen zu jedem Nachbarn sind. Dadurch haben näher gelegene Nachbarn einen stärkeren Einfluss auf den imputierten Wert.
In dieser Übung wendest du die distanzgewichtete Aggregation bei der Imputation der tao-Daten an. Dazu musst du der Funktion kNN() lediglich zwei zusätzliche Argumente übergeben. Probieren wir es aus!
Diese Übung ist Teil des Kurses
Fehlende Daten mit Imputationen in R behandeln
Anleitung zur Übung
- Lade das Paket
VIM. - Imputiere
humiditymit kNN und verwende den distanzgewichteten Mittelwert zur Aggregation der Nachbarn; du musst die ArgumentenumFunundweightDistangeben. - Das Margin-Plot zur Ansicht der Ergebnisse wurde bereits für dich vorbereitet.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load the VIM package
___(___)
# Impute humidity with kNN using distance-weighted mean
tao_imp <- ___(tao,
k = 5,
variable = "humidity",
___ = ___,
___ = ___)
tao_imp %>%
select(sea_surface_temp, humidity, humidity_imp) %>%
marginplot(delimiter = "imp")