Memvisualisasikan kepentingan fitur: Fitur apa yang paling penting dalam himpunan data saya
Cara lain untuk memvisualisasikan model XGBoost Anda adalah dengan menelaah tingkat kepentingan setiap kolom fitur dalam himpunan data asli di dalam model.
Salah satu cara sederhana adalah menghitung berapa kali setiap fitur digunakan untuk pemisahan di seluruh putaran boosting (pohon) pada model, lalu memvisualisasikannya sebagai grafik batang, dengan fitur diurutkan berdasarkan frekuensi kemunculannya. XGBoost memiliki fungsi plot_importance() yang memungkinkan Anda melakukan hal ini, dan Anda akan berkesempatan menggunakannya dalam latihan ini!
Latihan ini merupakan bagian dari kursus
Extreme Gradient Boosting dengan XGBoost
Instruksi latihan
- Buat
DMatrixdariXdanyseperti sebelumnya. - Buat kamus parameter dengan
"objective"yang sesuai ("reg:squarederror") dan"max_depth"bernilai4. - Latih model dengan
10putaran boosting, persis seperti yang Anda lakukan pada latihan sebelumnya. - Gunakan
xgb.plot_importance()dan teruskan model yang telah dilatih untuk menghasilkan grafik kepentingan fitur.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create the DMatrix: housing_dmatrix
housing_dmatrix = ____
# Create the parameter dictionary: params
params = ____
# Train the model: xg_reg
xg_reg = ____
# Plot the feature importances
____
plt.show()