IniziaInizia gratis

Approccio del validation set

Nel capitolo sulla regressione lineare, hai adattato un modello di regressione lineare che spiega il peso del cuore dei gatti a partire dal loro peso corporeo. Il selezionatore ti chiede di valutare quanto è buono il tuo modello.

Per rispondere, devi ottenere delle previsioni da confrontare con i valori reali. Nell'approccio del validation set, dividi i dati in due parti.

Per farlo, puoi prima prendere un campione pari, ad esempio, all'80% dei numeri di riga. Usa i numeri di riga scelti per creare il sottoinsieme di training. Il resto del data frame può essere usato per il testing.

Ricorda che:

rows <- c(1, 3)
df[-rows, ]

seleziona tutte tranne la prima e la terza riga.

Il dataset cats è disponibile nel tuo ambiente.

Questo esercizio fa parte del corso

Esercitarsi con le domande di statistica per i colloqui in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

set.seed(123)

# Generate train row numbers
train_rows <- ___(nrow(___), round(0.8 * ___(cats)))
Modifica ed esegui il codice