1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Support Vector Machines v R

Connected

Cvičení

Vytvoření trénovací a testovací sady

Rozdělení datasetu na trénovací a testovací sadu je důležitým krokem při sestavování a vyhodnocování klasifikačního modelu. Trénovací sada slouží k natrénování modelu a testovací sada k ověření jeho predikční přesnosti.

V tomto cvičení rozdělíš dataset vytvořený v předchozí kapitole na trénovací a testovací sadu. Dataset je načten v datovém rámci df a seed již byl nastaven, aby byly výsledky reprodukovatelné. Vzpomeň si, že v předchozím videu jsme pomocí několika šikovných funkcí určili horní hranici délky trénovací sady – teď je řada na tobě, abys je použil/a v praxi!

Pokyny

100 XP
  • Urči horní hranici počtu řádků trénovací sady a ulož ji do proměnné sample_size.
  • Vytvoř vektor train, který bude obsahovat náhodně přiřazené indexy trénovací sady podle poměru 80/20.
  • Přiřaď řádky obsažené ve vektoru train do datového rámce trainset a zbývající řádky do datového rámce testset.