MulaiMulai sekarang secara gratis

Mengekstrak parameter Random Forest

Sekarang Anda akan menerjemahkan pekerjaan yang sebelumnya dilakukan pada model logistic regression ke model random forest. Salah satu parameter model ini adalah, untuk setiap pohon, bagaimana ia memutuskan pemisahan pada tiap level.

Analisis ini tidak seberguna koefisien pada logistic regression karena Anda kecil kemungkinan untuk menelusuri setiap pemisahan dan setiap pohon dalam model random forest. Namun, ini adalah latihan yang sangat bermanfaat untuk mengintip apa yang dilakukan model di balik layar.

Pada latihan ini kita akan mengekstrak satu pohon dari model random forest kita, memvisualisasikannya, dan mengekstrak salah satu pemisahnya secara terprogram.

Anda memiliki:

  • Objek model random forest, rf_clf
  • Gambar bagian atas pohon keputusan yang dipilih, tree_viz_image
  • DataFrame X_train & daftar original_variables

Latihan ini adalah bagian dari kursus

Penyetelan Hyperparameter di Python

Lihat Kursus

Petunjuk latihan

  • Ekstrak pohon ke-7 (indeks ke-6) dari model random forest.
  • Visualisasikan pohon ini (tree_viz_image) untuk melihat keputusan pemisahannya.
  • Ekstrak fitur dan level dari pemisahan teratas.
  • Cetak fitur dan level tersebut secara bersamaan.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Extract the 7th (index 6) tree from the random forest
chosen_tree = rf_clf.estimators_[____]

# Visualize the graph using the provided image
imgplot = plt.imshow(____)
plt.show()

# Extract the parameters and level of the top (index 0) node
split_column = chosen_tree.tree_.feature[____]
split_column_name = X_train.columns[split_column]
split_value = chosen_tree.tree_.threshold[____]

# Print out the feature and level
print("This node split on feature {}, at a value of {}".format(split_column_name, ____))
Edit dan Jalankan Kode