Jamur: urusan hidup atau mati
Mari menutup kursus ini dengan meninjau kembali permasalahan kelayakan konsumsi jamur. Anda akan mencoba classifier stacking untuk melihat apakah skornya dapat ditingkatkan. Karena stacking menggunakan meta-estimator (classifier lapis kedua) yang berupaya mengoreksi prediksi dari lapis pertama, beberapa instance yang salah klasifikasi dapat diperbaiki. Ini adalah masalah yang sangat penting, karena kelayakan konsumsi jamur berkaitan dengan urusan hidup atau mati.
Himpunan data telah dimuat dan dibagi menjadi himpunan latih dan uji. Menurut Anda, apakah stacking dapat membantu memprediksi kelayakan konsumsi jamur dengan keyakinan yang lebih tinggi?
Latihan ini adalah bagian dari kursus
Metode Ensemble di Python
Petunjuk latihan
- Instansiasikan estimator lapis pertama: 5-nearest neighbors menggunakan algoritma ball tree, classifier pohon keputusan dengan parameter
min_samples_leaf = 5danmin_samples_split = 15, serta classifier Gaussian Naive Bayes. - Bangun dan latih classifier stacking, dengan parameter
classifiers— daftar yang berisi classifier lapis pertama — danmeta_classifier— logistic regression bawaan.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the first-layer models
clf_knn = ____
clf_dt = ____(____, ____, random_state=500)
clf_nb = ____
# Create the second-layer model (meta-model)
clf_lr = LogisticRegression()
# Create and fit the stacked model
clf_stack = ____
clf_stack.fit(X_train, y_train)
# Evaluate the stacked model’s performance
print("Accuracy: {:0.4f}".format(accuracy_score(y_test, clf_stack.predict(X_test))))