1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning with Tree-Based Models in R

Connected

cvičení

Rozdělení na trénovací a testovací sadu

Aby ses mohl/a přesvědčit, jak dobře model funguje, je potřeba ho trénovat a testovat na dvou různých částech dat – jinak by to bylo jako podvádět u zkoušky (když znáš odpovědi předem).

Rozdělení dat je nedílnou součástí procesu modelování. Procvičíš si ho na datech o diabetu a ověříš, že jsou výsledné proporce správné.

Data diabetes z předchozího cvičení jsou předem načtena v tvém pracovním prostředí.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Rozděl tibble diabetes do objektu diabetes_split v poměru 80 % trénovací a 20 % testovací data.
  • Výsledný objekt vypiš.