Prediksi churn dengan decision tree

Sekarang Anda akan membangun dari keterampilan yang diperoleh pada latihan sebelumnya, dan membuat decision tree yang lebih kompleks dengan parameter tambahan untuk memprediksi churn pelanggan. Anda akan membahas masalah prediksi churn lebih mendalam pada bab berikutnya. Di sini Anda akan menjalankan decision tree classifier kembali pada data pelatihan, memprediksi tingkat churn pada data yang belum terlihat (uji), dan menilai akurasi model pada kedua himpunan data.

Modul tree dari pustaka sklearn telah dimuat untuk Anda, begitu juga fungsi accuracy_score dari sklearn.metrics. Fitur dan variabel target juga telah diimpor sebagai train_X, train_Y untuk data pelatihan, serta test_X, test_Y untuk data uji.

Latihan ini merupakan bagian dari kursus

Machine Learning untuk Pemasaran dengan Python

Lihat Kursus

Instruksi latihan

Inisialisasi Decision tree dengan kedalaman maksimum (maximum depth) disetel ke 7 dan menggunakan kriteria gini.
Latih model pada data pelatihan.
Prediksi nilai pada himpunan data uji.
Cetak nilai akurasi untuk himpunan data pelatihan dan uji.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Initialize the Decision Tree
clf = tree.DecisionTreeClassifier(max_depth = ___, 
               criterion = 'gini', 
               splitter  = 'best')

# Fit the model to the training data
clf = clf.___(train_X, train_Y)

# Predict the values on test dataset
pred_Y = clf.___(test_X)

# Print accuracy values
print("Training accuracy: ", np.round(clf.score(train_X, train_Y), 3)) 
print("Test accuracy: ", np.round(___(test_Y, pred_Y), 3))

Edit dan Jalankan Kode