Combinare metodi di preprocessing

L'argomento preProcess di train() non si limita all'imputazione dei valori mancanti. Include anche un'ampia varietà di altre tecniche di preProcess che ti rendono la vita da data scientist molto più semplice. Puoi leggerne l'elenco completo digitando ?preProcess e consultando la pagina di help della funzione.

Un insieme di funzioni di preprocessing particolarmente utile per adattare modelli di regressione è la standardizzazione: centratura e scalatura. Per prima cosa esegui la centratura sottraendo la media di ciascuna colonna da ogni valore in quella colonna, poi esegui la scalatura dividendo per la deviazione standard.

La standardizzazione trasforma i tuoi dati in modo che, per ogni colonna, la media sia 0 e la deviazione standard sia 1. Questo rende più semplice per i modelli di regressione trovare una buona soluzione.

Questo esercizio fa parte del corso

Machine Learning con caret in R

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Fit glm with median imputation
model <- train(
  x = ___, 
  y = ___,
  method = ___,
  trControl = myControl,
  preProcess = ___
)

# Print model

Modifica ed esegui il codice