Panoramica dei dati master
Finora hai combinato le informazioni dei dataset rating e survey con il tuo dataset originale.
Nel dataset org_final abbiamo aggiunto altre informazioni relative ai dipendenti, come compensation, no_leaves_taken (numero di giorni di ferie presi), hiring_source ecc. Dai un’occhiata a questo dataset prima di passare al feature engineering nel prossimo capitolo.
Questo esercizio fa parte del corso
HR Analytics: prevedere il turnover dei dipendenti in R
Istruzioni dell'esercizio
- Usa
glimpse()per visualizzare la struttura del datasetorg_final. - Assegna il numero di variabili del dataset
org_finalavariables. - Genera un box plot per visualizzare la distribuzione di
distance_from_homeper i dipendentiActiveeInactive.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# View the structure of the dataset
___
# Number of variables in the dataset
variables <- ___
# Compare the travel distance of Active and Inactive employees
ggplot(org_final, aes(x = ___, y = ___)) +
___