Suddividi i dati
In questo esercizio, suddividerai i dati in training e test set usando il pacchetto caret. Nelle prossime lezioni userai il training set per costruire modelli di regressione logistica e il test set per validare questi modelli.
Questo esercizio fa parte del corso
HR Analytics: prevedere il turnover dei dipendenti in R
Istruzioni dell'esercizio
- Carica il pacchetto
caret. - Imposta un seed a 567 e crea una partizione che divida l'insieme di dati
emp_finalin sezioni train/test 70% / 30%. - Crea il training set selezionando, dal dataset
emp_final, i numeri di riga memorizzati inindex_train. - Assegna le osservazioni rimanenti di
emp_finalal test set.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Load caret
___
# Set seed of 567
___
# Store row numbers for training dataset: index_train
index_train <- ___(emp_final$turnover, p = ___, list = FALSE)
# Create training dataset: train_set
train_set <- emp_final[___, ]
# Create testing dataset: test_set
test_set <- emp_final[___, ]