Pipeline pertama Anda
Rekan Anda telah menggunakan AdaBoostClassifier untuk himpunan data penilaian kredit. Anda juga ingin mencoba classifier random forest. Pada latihan ini, Anda akan melatih classifier tersebut pada data dan membandingkannya dengan AdaBoostClassifier. Pastikan untuk menggunakan pemisahan data latih/uji guna menghindari overfitting. Data sudah dimuat dan ditransformasikan sehingga semua fitur bersifat numerik. Fitur tersedia sebagai X dan label sebagai y. Modul RandomForestClassifier juga sudah dimuat sebelumnya.
Latihan ini adalah bagian dari kursus
Merancang Alur Kerja Machine Learning di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Split the data into train and test, with 20% as test
X_train, ____, ____, y_test = train_test_split(
X, y, ____=0.2, random_state=1)