Aan de slagBegin gratis

Train/test-split

Om je modellen te testen, moet je het model trainen en testen op twee verschillende delen van de data — anders is het alsof je spiekt bij een examen (je kent de antwoorden al).

De datasplit is een essentieel onderdeel van het modelleerproces. Je gaat hiermee aan de slag door de diabetesdata te splitsen en de verhoudingen van de split te controleren.

De diabetes-data uit de vorige oefening is vooraf in je werkruimte geladen.

Deze oefening maakt deel uit van de cursus

Machine Learning met boomgebaseerde modellen in R

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create the split
diabetes_split <- ___(___, prop = ___)

# Print the data split
___
Code bewerken en uitvoeren