MulaiMulai sekarang secara gratis

Memvisualisasikan kepentingan fitur: Fitur apa yang paling penting dalam himpunan data saya

Cara lain untuk memvisualisasikan model XGBoost Anda adalah dengan menelaah tingkat kepentingan setiap kolom fitur dalam himpunan data asli di dalam model.

Salah satu cara sederhana adalah menghitung berapa kali setiap fitur digunakan untuk pemisahan di seluruh putaran boosting (pohon) pada model, lalu memvisualisasikannya sebagai grafik batang, dengan fitur diurutkan berdasarkan frekuensi kemunculannya. XGBoost memiliki fungsi plot_importance() yang memungkinkan Anda melakukan hal ini, dan Anda akan berkesempatan menggunakannya dalam latihan ini!

Latihan ini adalah bagian dari kursus

Extreme Gradient Boosting dengan XGBoost

Lihat Kursus

Petunjuk latihan

  • Buat DMatrix dari X dan y seperti sebelumnya.
  • Buat kamus parameter dengan "objective" yang sesuai ("reg:squarederror") dan "max_depth" bernilai 4.
  • Latih model dengan 10 putaran boosting, persis seperti yang Anda lakukan pada latihan sebelumnya.
  • Gunakan xgb.plot_importance() dan teruskan model yang telah dilatih untuk menghasilkan grafik kepentingan fitur.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create the DMatrix: housing_dmatrix
housing_dmatrix = ____

# Create the parameter dictionary: params
params = ____

# Train the model: xg_reg
xg_reg = ____

# Plot the feature importances
____
plt.show()
Edit dan Jalankan Kode