IniziaInizia gratis

Panoramica dei dati master

Finora hai combinato le informazioni dei dataset rating e survey con il tuo dataset originale.

Nel dataset org_final abbiamo aggiunto altre informazioni relative ai dipendenti, come compensation, no_leaves_taken (numero di giorni di ferie presi), hiring_source ecc. Dai un’occhiata a questo dataset prima di passare al feature engineering nel prossimo capitolo.

Questo esercizio fa parte del corso

HR Analytics: prevedere il turnover dei dipendenti in R

Visualizza il corso

Istruzioni dell'esercizio

  • Usa glimpse() per visualizzare la struttura del dataset org_final.
  • Assegna il numero di variabili del dataset org_final a variables.
  • Genera un box plot per visualizzare la distribuzione di distance_from_home per i dipendenti Active e Inactive.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# View the structure of the dataset
___

# Number of variables in the dataset
variables <- ___

# Compare the travel distance of Active and Inactive employees
ggplot(org_final, aes(x = ___, y = ___)) +
  ___
Modifica ed esegui il codice