IniziaInizia gratis

Suddividi i dati

In questo esercizio, suddividerai i dati in training e test set usando il pacchetto caret. Nelle prossime lezioni userai il training set per costruire modelli di regressione logistica e il test set per validare questi modelli.

Questo esercizio fa parte del corso

HR Analytics: prevedere il turnover dei dipendenti in R

Visualizza il corso

Istruzioni dell'esercizio

  • Carica il pacchetto caret.
  • Imposta un seed a 567 e crea una partizione che divida l'insieme di dati emp_final in sezioni train/test 70% / 30%.
  • Crea il training set selezionando, dal dataset emp_final, i numeri di riga memorizzati in index_train.
  • Assegna le osservazioni rimanenti di emp_final al test set.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Load caret
___

# Set seed of 567
___

# Store row numbers for training dataset: index_train
index_train <- ___(emp_final$turnover, p = ___, list = FALSE)

# Create training dataset: train_set
train_set <- emp_final[___, ]

# Create testing dataset: test_set
test_set <- emp_final[___, ]
Modifica ed esegui il codice