1. Nauka
  2. /
  3. Kursy
  4. /
  5. Predykcyjna analityka sieciowa w R

Connected

ćwiczenie

Podział na zbiór treningowy i testowy

Teraz, gdy mamy już ramkę danych, możemy zastosować standardowe techniki modelowania. W tym ćwiczeniu podzielisz dane na zbiór treningowy i zbiór testowy.

Instrukcje

100 XP
  • Aby zapewnić odtwarzalność wyników, ustaw ziarno losowości na 7, używając funkcji set.seed().
  • Użyj funkcji sample(), aby wylosować dwie trzecie liczb z zakresu odpowiadającego łącznej liczbie wierszy w zbiorze studentnetworkdata. Zapisz ten wektor pod nazwą index_train.
  • Utwórz zbiór treningowy, wybierając wiersze ze zbioru studentnetworkdata o indeksach zapisanych w index_train, i nadaj mu nazwę training_set.
  • Utwórz zbiór testowy, wykluczając wiersze ze zbioru studentnetworkdata o indeksach zapisanych w index_train, i nadaj mu nazwę test_set.