IniziaInizia gratis

Predici sul test set

Ora che hai suddiviso casualmente un training set e un test set, puoi usare la funzione lm() come nel primo esercizio per adattare un modello al training set invece che all’intero insieme di dati. Ricorda che puoi usare l’interfaccia a formula della regressione lineare per adattare un modello con una variabile target specificata usando tutte le altre variabili dell’insieme di dati come predittori:

mod <- lm(y ~ ., training_data)

Puoi usare la funzione predict() per generare previsioni da quel modello su nuovi dati. Il nuovo insieme di dati deve avere tutte le colonne del training set, ma possono essere in un ordine diverso con valori diversi. Qui, invece di ri-predictare sul training set, puoi prevedere sul test set, che non hai usato per addestrare il modello. Questo ti permetterà di determinare l’errore out-of-sample del modello nel prossimo esercizio:

p <- predict(model, new_data)

Questo esercizio fa parte del corso

Machine Learning con caret in R

Visualizza il corso

Istruzioni dell'esercizio

  • Adatta un modello lm() chiamato model per prevedere price usando tutte le altre variabili come covariate. Assicurati di usare il training set, train.
  • Effettua le previsioni sul test set, test, usando predict(). Memorizza questi valori in un vettore chiamato p.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Fit lm model on train: model


# Predict on test: p
Modifica ed esegui il codice