Adattare il modello ai dati di training
È il momento di dividere i dati in un insieme di training per adattare un modello e un insieme test separato per valutarne la capacità predittiva. Prima di fare questa divisione però, campioniamo innanzitutto il 100% delle righe di house_prices senza reinserimento e assegniamo il risultato a house_prices_shuffled. In questo modo "mescoliamo" le righe, assicurandoci che gli insiemi di training e test siano campionati in modo casuale.
Questo esercizio fa parte del corso
Modellazione con i dati nel Tidyverse
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Set random number generator seed value for reproducibility
set.seed(76)
# Randomly reorder the rows
house_prices_shuffled <- house_prices %>%
sample_frac(size = 1, replace = FALSE)
# Train/test split
train <- house_prices_shuffled %>%
slice(___:___)
test <- house_prices_shuffled %>%
slice(___:___)