Aan de slagGa gratis aan de slag

Train/test-split

Om je modellen te testen, moet je het model trainen en testen op twee verschillende delen van de data — anders is het alsof je spiekt bij een examen (je kent de antwoorden al).

De datasplit is een essentieel onderdeel van het modelleerproces. Je gaat hiermee aan de slag door de diabetesdata te splitsen en de verhoudingen van de split te controleren.

De diabetes-data uit de vorige oefening is vooraf in je werkruimte geladen.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create the split
diabetes_split <- ___(___, prop = ___)

# Print the data split
___
Code bewerken en uitvoeren