Seleksi fitur
Saat menyiapkan data untuk pemodelan, penting untuk memastikan Anda memiliki sekumpulan fitur yang membantu sebagai dasar prediksi (atau diagnosis) model. Agar bermanfaat, fitur harus menangkap karakteristik penting dari himpunan data penyakit jantung secara ortogonal; lebih banyak data tidak selalu lebih baik!
Anda dapat menggunakan modul sklearn.feature_selection.SelectFromModel untuk memilih fitur yang berguna. SelectFromModel mengimplementasikan metode brute force yang menggunakan model RandomForestClassifier untuk menemukan fitur paling menonjol dalam tugas diagnosis penyakit jantung.
RandomForestClassifier telah diimpor dan fitur serta target data penyakit jantung telah diimpor sebagai X_train dan y_train.
Latihan ini adalah bagian dari kursus
Machine Learning Ujung ke Ujung
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from sklearn.feature_selection import SelectFromModel
# Define the random forest model and fit to the training data
rf = ____(____=____, ____=____, ____=____)
rf.____(____, ____)