Predici sul test set
Ora che hai suddiviso casualmente un training set e un test set, puoi usare la funzione lm() come nel primo esercizio per adattare un modello al training set invece che all’intero insieme di dati. Ricorda che puoi usare l’interfaccia a formula della regressione lineare per adattare un modello con una variabile target specificata usando tutte le altre variabili dell’insieme di dati come predittori:
mod <- lm(y ~ ., training_data)
Puoi usare la funzione predict() per generare previsioni da quel modello su nuovi dati. Il nuovo insieme di dati deve avere tutte le colonne del training set, ma possono essere in un ordine diverso con valori diversi. Qui, invece di ri-predictare sul training set, puoi prevedere sul test set, che non hai usato per addestrare il modello. Questo ti permetterà di determinare l’errore out-of-sample del modello nel prossimo esercizio:
p <- predict(model, new_data)
Questo esercizio fa parte del corso
Machine Learning con caret in R
Istruzioni dell'esercizio
- Adatta un modello
lm()chiamatomodelper prevederepriceusando tutte le altre variabili come covariate. Assicurati di usare il training set,train. - Effettua le previsioni sul test set,
test, usandopredict(). Memorizza questi valori in un vettore chiamatop.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit lm model on train: model
# Predict on test: p