Twee steekproeven
Na het bouwen van meerdere classificatiemodellen op basis van de tic_tac_toe-gegevensset merk je dat sommige modellen minder goed generaliseren dan andere. Je hebt trainings- en test-splits gemaakt zoals je hebt geleerd, dus je vraagt je af waarom je validatieproces niet werkt.
Na een andere train-test-split te proberen, zag je verschillende accuracies voor je Machine Learning-model. Voordat je je te veel ergert aan de wisselende resultaten, besluit je te onderzoeken wat er nog meer aan de hand kan zijn.
Deze oefening maakt deel uit van de cursus
Modelvalidatie in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create two different samples of 200 observations
sample1 = tic_tac_toe.____(____, random_state=1111)
sample2 = tic_tac_toe.____(____, random_state=1171)