Memvisualisasikan kepentingan fitur: Fitur apa yang paling penting dalam himpunan data saya
Cara lain untuk memvisualisasikan model XGBoost Anda adalah dengan menelaah tingkat kepentingan setiap kolom fitur dalam himpunan data asli di dalam model.
Salah satu cara sederhana adalah menghitung berapa kali setiap fitur digunakan untuk pemisahan di seluruh putaran boosting (pohon) pada model, lalu memvisualisasikannya sebagai grafik batang, dengan fitur diurutkan berdasarkan frekuensi kemunculannya. XGBoost memiliki fungsi plot_importance() yang memungkinkan Anda melakukan hal ini, dan Anda akan berkesempatan menggunakannya dalam latihan ini!
Latihan ini adalah bagian dari kursus
Extreme Gradient Boosting dengan XGBoost
Petunjuk latihan
- Buat
DMatrixdariXdanyseperti sebelumnya. - Buat kamus parameter dengan
"objective"yang sesuai ("reg:squarederror") dan"max_depth"bernilai4. - Latih model dengan
10putaran boosting, persis seperti yang Anda lakukan pada latihan sebelumnya. - Gunakan
xgb.plot_importance()dan teruskan model yang telah dilatih untuk menghasilkan grafik kepentingan fitur.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the DMatrix: housing_dmatrix
housing_dmatrix = ____
# Create the parameter dictionary: params
params = ____
# Train the model: xg_reg
xg_reg = ____
# Plot the feature importances
____
plt.show()