Menerapkan stacking untuk memprediksi penilaian aplikasi
Pada latihan ini Anda akan mulai membangun Stacking ensemble pertama Anda. Himpunan data yang digunakan adalah yang pertama kali kita gunakan pada Bab 1. Jika Anda ingat, tujuannya adalah memprediksi penilaian setiap aplikasi (dari 1 sampai 5). Fitur masukan yang digunakan: Reviews, Size, Installs, Type, Price, dan Content Rating.
Kami sudah menyelesaikan langkah 1: menyiapkan himpunan data. Data tersedia sebagai apps. Kami telah membersihkan fitur yang diperlukan dan mengganti nilai yang hilang dengan nol.
Sekarang, Anda akan mengerjakan langkah 2: membangun estimator lapisan pertama.
Latihan ini merupakan bagian dari kursus
Metode Ensemble di Python
Instruksi latihan
- Bangun dan latih decision tree classifier dengan:
min_samples_leaf: 3danmin_samples_split: 9. - Bangun dan latih classifier 5-nearest neighbors menggunakan:
algorithm: 'ball_tree'(untuk mempercepat pemrosesan). - Evaluasi kinerja tiap estimator menggunakan accuracy score pada himpunan uji.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Build and fit a Decision Tree classifier
clf_dt = ____(____, ____, random_state=500)
clf_dt.____
# Build and fit a 5-nearest neighbors classifier using the 'Ball-Tree' algorithm
clf_knn = ____
clf_knn.____
# Evaluate the performance using the accuracy score
print('Decision Tree: {:0.4f}'.format(accuracy_score(____)))
print('5-Nearest Neighbors: {:0.4f}'.format(accuracy_score(____)))