1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Machine Learning in the Tidyverse

Connected

Cvičení

Datové rámce pro křížovou validaci

Teď, když jsi část dat vyhradil/a jako testovací data, můžeš zbývající část využít k nalezení nejlépe fungujícího modelu.

V tomto cvičení rozdělíš trénovací data do série 5 trénovacích a validačních sad pomocí funkce vfold_cv() z balíčku rsample.

Pokyny

100 XP
  • Ze training_data vytvoř datový rámec pro 5-násobnou křížovou validaci pomocí vfold_cv() a výsledek ulož do cv_split.
  • Připrav cv_data tak, že do cv_split přidáš dva nové sloupce:
    • train: obsahující trénovací datové rámce získané mapováním funkce training() přes sloupec splits.
    • validate: obsahující validační datové rámce získané mapováním funkce testing() přes sloupec splits.