1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Prediktivní analytika pomocí síťových dat v R

Connected

cvičení

Rozdělení na trénovací a testovací sadu

Teď, když máme dataframe, můžeme použít standardní techniky modelování. V tomto cvičení rozdělíš data na trénovací a testovací sadu.

Pokyny

100 XP
  • Aby byly tvoje výsledky reprodukovatelné, nastav seed na hodnotu 7 pomocí set.seed().
  • Pomocí funkce sample() vyber náhodně dvě třetiny čísel z rozsahu celkového počtu řádků v studentnetworkdata. Tento vektor pojmenuj index_train.
  • Vytvoř trénovací sadu tak, že z studentnetworkdata vybereš řádky uložené v index_train, a pojmenuj ji training_set.
  • Vytvoř testovací sadu tak, že z studentnetworkdata vyloučíš řádky uložené v index_train, a pojmenuj ji test_set.