IniziaInizia gratis

kNN: trucchi e consigli I — pesare i donatori

Una variante spesso usata dell'imputazione kNN applica la cosiddetta aggregazione pesata per distanza. In pratica, quando aggreghiamo i valori dei vicini per ottenere la sostituzione di un valore mancante, usiamo la media pesata e i pesi sono le distanze inverse da ciascun vicino. Di conseguenza, i vicini più prossimi influenzano maggiormente il valore imputato.

In questo esercizio applicherai l'aggregazione pesata per distanza mentre imputi i dati tao. Ti basterà passare due argomenti aggiuntivi alla funzione kNN(). Proviamoci!

Questo esercizio fa parte del corso

Gestione dei dati mancanti con imputazioni in R

Visualizza il corso

Istruzioni dell'esercizio

  • Carica il pacchetto VIM.
  • Imputa humidity con kNN usando la media pesata per distanza per aggregare i vicini; dovrai specificare gli argomenti numFun e weightDist.
  • Il margin plot per visualizzare i risultati è già stato scritto per te.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load the VIM package
___(___)

# Impute humidity with kNN using distance-weighted mean
tao_imp <- ___(tao, 
               k = 5, 
               variable = "humidity", 
               ___ = ___,
               ___ = ___)

tao_imp %>% 
	select(sea_surface_temp, humidity, humidity_imp) %>% 
	marginplot(delimiter = "imp")
Modifica ed esegui il codice