Memvisualisasikan pentingnya fitur
Dalam latihan ini, Anda akan menentukan fitur mana yang paling prediktif menurut random forests regressor rf yang telah Anda latih pada latihan sebelumnya.
Untuk tujuan ini, Anda akan menggambar barplot horizontal dari tingkat kepentingan fitur sebagaimana dinilai oleh rf. Untungnya, hal ini dapat dilakukan dengan mudah berkat kemampuan plotting dari pandas.
Kami telah membuat objek pandas.Series bernama importances yang berisi nama fitur sebagai index dan nilai kepentingannya sebagai value. Selain itu, matplotlib.pyplot tersedia sebagai plt dan pandas sebagai pd.
Latihan ini merupakan bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di Python
Instruksi latihan
Panggil metode
.sort_values()padaimportancesdan simpan hasilnya keimportances_sorted.Panggil metode
.plot()padaimportances_sorteddan atur argumen:kindmenjadi'barh'colormenjadi'lightgreen'
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create a pd.Series of features importances
importances = pd.Series(data=rf.feature_importances_,
index= X_train.columns)
# Sort importances
importances_sorted = ____
# Draw a horizontal barplot of importances_sorted
____.____(____='____', ____='____')
plt.title('Features Importances')
plt.show()