IniziaInizia gratis

Adattare il modello ai dati di training

È il momento di dividere i dati in un insieme di training per adattare un modello e un insieme test separato per valutarne la capacità predittiva. Prima di fare questa divisione però, campioniamo innanzitutto il 100% delle righe di house_prices senza reinserimento e assegniamo il risultato a house_prices_shuffled. In questo modo "mescoliamo" le righe, assicurandoci che gli insiemi di training e test siano campionati in modo casuale.

Questo esercizio fa parte del corso

Modellazione con i dati nel Tidyverse

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Set random number generator seed value for reproducibility
set.seed(76)

# Randomly reorder the rows
house_prices_shuffled <- house_prices %>% 
  sample_frac(size = 1, replace = FALSE)

# Train/test split
train <- house_prices_shuffled %>%
  slice(___:___)
test <- house_prices_shuffled %>%
  slice(___:___)
Modifica ed esegui il codice