1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with Tree-Based Models in R

Connected

cvičení

Vytvoření skupin (folds)

Jednorázové rozdělení dat na trénovací a testovací sadu s sebou nese určitá statistická rizika – může se stát, že testovací sada bude obsahovat jen vysoko hodnocené boby kakaa, zatímco všechny ty hůře hodnocené skončí v sadě trénovací. Navíc tak výkon modelu změříš jen jednou.

Křížová validace (cross-validation) ti poskytne robustnější odhad výkonu modelu na nových datech bez těchto statistických úskalí – model vyhodnotí důkladněji.

V tomto cvičení vytvoříš skupiny (folds) z trénovacích dat chocolate_train, která jsou předem načtena.

Pokyny

100 XP
  • Nastav seed na hodnotu 20 pro zajištění reprodukovatelnosti.
  • Vytvoř 10 skupin (folds) z chocolate_train a výsledek ulož jako chocolate_folds.