Tingkat kepentingan fitur
Meskipun beberapa atribut permen, seperti cokelat, mungkin sangat populer, bukan berarti atribut tersebut akan penting bagi prediksi model. Setelah model random forest dipasang (fit), Anda dapat meninjau atribut model, .feature_importances_, untuk melihat variabel mana yang berdampak paling besar. Anda dapat memeriksa seberapa penting setiap variabel dalam model dengan melakukan perulangan pada array tingkat kepentingan fitur menggunakan enumerate().
Jika Anda belum familiar dengan fungsi enumerate() di Python, fungsi ini dapat melakukan perulangan pada sebuah daftar sambil membuat pencacah otomatis.
Latihan ini adalah bagian dari kursus
Validasi Model di Python
Petunjuk latihan
- Lakukan perulangan melalui keluaran tingkat kepentingan fitur dari
rfr. - Cetak nama kolom dari
X_traindan skor kepentingan untuk kolom tersebut.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Fit the model using X and y
rfr.fit(X_train, y_train)
# Print how important each column is to the model
for i, item in enumerate(rfr.____):
# Use i and item to print out the feature importance of each column
print("{0:s}: {1:.2f}".format(X_train.columns[____], ____))