Train/test-split
Om je modellen te testen, moet je het model trainen en testen op twee verschillende delen van de data — anders is het alsof je spiekt bij een examen (je kent de antwoorden al).
De datasplit is een essentieel onderdeel van het modelleerproces. Je gaat hiermee aan de slag door de diabetesdata te splitsen en de verhoudingen van de split te controleren.
De diabetes-data uit de vorige oefening is vooraf in je werkruimte geladen.
Deze oefening maakt deel uit van de cursus
Machine Learning met boomgebaseerde modellen in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the split
diabetes_split <- ___(___, prop = ___)
# Print the data split
___