IniziaInizia gratis

Sviluppa e testa il modello migliore

Nel Capitolo 3 hai scoperto che i seguenti parametri consentono di ottenere un modello migliore:

  • max_depth = 8,
  • min_samples_leaf = 150,
  • class_weight = "balanced"

In questo capitolo, hai visto che alcune feature hanno un impatto trascurabile. Hai capito che puoi ottenere previsioni accurate usando solo un piccolo numero di feature selezionate e rilevanti e hai aggiornato di conseguenza i tuoi insiemi di training e test, creando le variabili features_train_selected e features_test_selected.

Con tutte queste informazioni a disposizione, ora svilupperai il miglior modello per prevedere il turnover dei dipendenti e lo valuterai usando le metriche appropriate.

Le variabili features_train_selected e features_test_selected sono disponibili nel tuo workspace e le funzioni recall_score e roc_auc_score sono già state importate per te.

Questo esercizio fa parte del corso

HR Analytics: prevedere l'abbandono dei dipendenti in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Inizializza il modello migliore usando i parametri forniti nella descrizione.
  • Esegui il fit del modello utilizzando solo le feature selezionate del training set.
  • Effettua una previsione basata sulle feature selezionate del test set.
  • Stampa le metriche di accuratezza, recall e ROC/AUC del modello.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Initialize the best model using parameters provided in description
model_best = DecisionTreeClassifier(____=____, ____=____, ____=____, random_state=42)

# Fit the model using only selected features from training set: done
model_best.fit(____, target_train)

# Make prediction based on selected list of features from test set
prediction_best = model_best.____(____)

# Print the general accuracy of the model_best
print(____.score(features_test_selected, target_test) * 100)

# Print the recall score of the model predictions
print(____(target_test, prediction_best) * 100)

# Print the ROC/AUC score of the model predictions
print(roc_auc_score(target_test, ____) * 100)
Modifica ed esegui il codice