MulaiMulai sekarang secara gratis

Memvisualisasikan pentingnya fitur

Dalam latihan ini, Anda akan menentukan fitur mana yang paling prediktif menurut random forests regressor rf yang telah Anda latih pada latihan sebelumnya.

Untuk tujuan ini, Anda akan menggambar barplot horizontal dari tingkat kepentingan fitur sebagaimana dinilai oleh rf. Untungnya, hal ini dapat dilakukan dengan mudah berkat kemampuan plotting dari pandas.

Kami telah membuat objek pandas.Series bernama importances yang berisi nama fitur sebagai index dan nilai kepentingannya sebagai value. Selain itu, matplotlib.pyplot tersedia sebagai plt dan pandas sebagai pd.

Latihan ini adalah bagian dari kursus

Machine Learning dengan Model Berbasis Pohon di Python

Lihat Kursus

Petunjuk latihan

  • Panggil metode .sort_values() pada importances dan simpan hasilnya ke importances_sorted.

  • Panggil metode .plot() pada importances_sorted dan atur argumen:

    • kind menjadi 'barh'
    • color menjadi 'lightgreen'

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
                        index= X_train.columns)

# Sort importances
importances_sorted = ____

# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()
Edit dan Jalankan Kode