Approccio del validation set
Nel capitolo sulla regressione lineare, hai adattato un modello di regressione lineare che spiega il peso del cuore dei gatti a partire dal loro peso corporeo. Il selezionatore ti chiede di valutare quanto è buono il tuo modello.
Per rispondere, devi ottenere delle previsioni da confrontare con i valori reali. Nell'approccio del validation set, dividi i dati in due parti.
Per farlo, puoi prima prendere un campione pari, ad esempio, all'80% dei numeri di riga. Usa i numeri di riga scelti per creare il sottoinsieme di training. Il resto del data frame può essere usato per il testing.

Ricorda che:
rows <- c(1, 3)
df[-rows, ]
seleziona tutte tranne la prima e la terza riga.
Il dataset cats è disponibile nel tuo ambiente.
Questo esercizio fa parte del corso
Esercitarsi con le domande di statistica per i colloqui in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
set.seed(123)
# Generate train row numbers
train_rows <- ___(nrow(___), round(0.8 * ___(cats)))