kNN: trucchi e consigli I — pesare i donatori
Una variante spesso usata dell'imputazione kNN applica la cosiddetta aggregazione pesata per distanza. In pratica, quando aggreghiamo i valori dei vicini per ottenere la sostituzione di un valore mancante, usiamo la media pesata e i pesi sono le distanze inverse da ciascun vicino. Di conseguenza, i vicini più prossimi influenzano maggiormente il valore imputato.
In questo esercizio applicherai l'aggregazione pesata per distanza mentre imputi i dati tao. Ti basterà passare due argomenti aggiuntivi alla funzione kNN(). Proviamoci!
Questo esercizio fa parte del corso
Gestione dei dati mancanti con imputazioni in R
Istruzioni dell'esercizio
- Carica il pacchetto
VIM. - Imputa
humiditycon kNN usando la media pesata per distanza per aggregare i vicini; dovrai specificare gli argomentinumFuneweightDist. - Il margin plot per visualizzare i risultati è già stato scritto per te.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load the VIM package
___(___)
# Impute humidity with kNN using distance-weighted mean
tao_imp <- ___(tao,
k = 5,
variable = "humidity",
___ = ___,
___ = ___)
tao_imp %>%
select(sea_surface_temp, humidity, humidity_imp) %>%
marginplot(delimiter = "imp")