Train/test-split
Om je modellen te testen, moet je het model trainen en testen op twee verschillende delen van de data — anders is het alsof je spiekt bij een examen (je kent de antwoorden al).
De datasplit is een essentieel onderdeel van het modelleerproces. Je gaat hiermee aan de slag door de diabetesdata te splitsen en de verhoudingen van de split te controleren.
De diabetes-data uit de vorige oefening is vooraf in je werkruimte geladen.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in R
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Create the split
diabetes_split <- ___(___, prop = ___)
# Print the data split
___