MulaiMulai sekarang secara gratis

Kembangkan dan uji model terbaik

Pada Bab 3, Anda mengetahui bahwa parameter berikut memungkinkan Anda memperoleh model yang lebih baik:

  • max_depth = 8,
  • min_samples_leaf = 150,
  • class_weight = "balanced"

Di bab ini, Anda menemukan bahwa sebagian fitur berdampak sangat kecil. Anda menyadari bahwa Anda bisa mendapatkan prediksi yang akurat hanya dengan sejumlah kecil fitur terpilih yang berdampak besar dan Anda memperbarui himpunan pelatihan dan pengujian sesuai hal tersebut, sehingga membuat variabel features_train_selected dan features_test_selected.

Dengan seluruh informasi ini, sekarang Anda akan mengembangkan model terbaik untuk memprediksi turnover karyawan dan mengevaluasinya menggunakan metrik yang sesuai.

Variabel features_train_selected dan features_test_selected tersedia di workspace Anda, dan fungsi recall_score serta roc_auc_score telah diimpor untuk Anda.

Latihan ini adalah bagian dari kursus

Analitik SDM: Memprediksi Perputaran Karyawan dengan Python

Lihat Kursus

Petunjuk latihan

  • Inisialisasi model terbaik menggunakan parameter yang disediakan dalam deskripsi.
  • Latih model menggunakan hanya fitur terpilih dari himpunan pelatihan.
  • Buat prediksi berdasarkan fitur terpilih dari himpunan pengujian.
  • Cetak skor akurasi, recall, dan ROC/AUC dari model.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Initialize the best model using parameters provided in description
model_best = DecisionTreeClassifier(____=____, ____=____, ____=____, random_state=42)

# Fit the model using only selected features from training set: done
model_best.fit(____, target_train)

# Make prediction based on selected list of features from test set
prediction_best = model_best.____(____)

# Print the general accuracy of the model_best
print(____.score(features_test_selected, target_test) * 100)

# Print the recall score of the model predictions
print(____(target_test, prediction_best) * 100)

# Print the ROC/AUC score of the model predictions
print(roc_auc_score(target_test, ____) * 100)
Edit dan Jalankan Kode