Combinare metodi di preprocessing
L'argomento preProcess di train() non si limita all'imputazione dei valori mancanti. Include anche un'ampia varietà di altre tecniche di preProcess che ti rendono la vita da data scientist molto più semplice. Puoi leggerne l'elenco completo digitando ?preProcess e consultando la pagina di help della funzione.
Un insieme di funzioni di preprocessing particolarmente utile per adattare modelli di regressione è la standardizzazione: centratura e scalatura. Per prima cosa esegui la centratura sottraendo la media di ciascuna colonna da ogni valore in quella colonna, poi esegui la scalatura dividendo per la deviazione standard.
La standardizzazione trasforma i tuoi dati in modo che, per ogni colonna, la media sia 0 e la deviazione standard sia 1. Questo rende più semplice per i modelli di regressione trovare una buona soluzione.
Questo esercizio fa parte del corso
Machine Learning con caret in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit glm with median imputation
model <- train(
x = ___,
y = ___,
method = ___,
trControl = myControl,
preProcess = ___
)
# Print model