Suddivisione train/test
Per testare i tuoi modelli, devi addestrarli e valutarli su due parti diverse dei dati; altrimenti è come barare a un esame (conosci già le risposte).
La suddivisione dei dati è una parte fondamentale del processo di modellazione. La metterai in pratica dividendo i dati sul diabete e verificando le proporzioni dello split.
I dati diabetes dell'esercizio precedente sono già caricati nel tuo workspace.
Questo esercizio fa parte del corso
Machine Learning con modelli ad albero in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create the split
diabetes_split <- ___(___, prop = ___)
# Print the data split
___