Menerapkan stacking untuk memprediksi penilaian aplikasi
Pada latihan ini Anda akan mulai membangun Stacking ensemble pertama Anda. Himpunan data yang digunakan adalah yang pertama kali kita gunakan pada Bab 1. Jika Anda ingat, tujuannya adalah memprediksi penilaian setiap aplikasi (dari 1 sampai 5). Fitur masukan yang digunakan: Reviews, Size, Installs, Type, Price, dan Content Rating.
Kami sudah menyelesaikan langkah 1: menyiapkan himpunan data. Data tersedia sebagai apps. Kami telah membersihkan fitur yang diperlukan dan mengganti nilai yang hilang dengan nol.
Sekarang, Anda akan mengerjakan langkah 2: membangun estimator lapisan pertama.
Latihan ini adalah bagian dari kursus
Metode Ensemble di Python
Petunjuk latihan
- Bangun dan latih decision tree classifier dengan:
min_samples_leaf: 3danmin_samples_split: 9. - Bangun dan latih classifier 5-nearest neighbors menggunakan:
algorithm: 'ball_tree'(untuk mempercepat pemrosesan). - Evaluasi kinerja tiap estimator menggunakan accuracy score pada himpunan uji.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Build and fit a Decision Tree classifier
clf_dt = ____(____, ____, random_state=500)
clf_dt.____
# Build and fit a 5-nearest neighbors classifier using the 'Ball-Tree' algorithm
clf_knn = ____
clf_knn.____
# Evaluate the performance using the accuracy score
print('Decision Tree: {:0.4f}'.format(accuracy_score(____)))
print('5-Nearest Neighbors: {:0.4f}'.format(accuracy_score(____)))