Klasifikator Random Forest - bagian 1
Sekarang mari membuat random forest classifier pertama untuk deteksi kecurangan. Semoga Anda dapat melampaui akurasi baseline yang baru saja dihitung, yakni sekitar 96%. Model ini akan menjadi model "baseline" yang akan Anda coba tingkatkan pada latihan berikutnya. Mulailah dengan membagi data menjadi himpunan latih dan uji, serta mendefinisikan model Random Forest. Data yang tersedia adalah fitur X dan label y.
Latihan ini merupakan bagian dari kursus
Deteksi Kecurangan di Python
Instruksi latihan
- Impor random forest classifier dari
sklearn. - Bagi fitur
Xdan labelyAnda menjadi himpunan latih dan uji. Sisihkan himpunan uji sebesar 30%. - Tetapkan random forest classifier ke
modeldan pertahankanrandom_statepada 5. Kita perlu menetapkan random state di sini agar dapat membandingkan hasil di berbagai model.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import the random forest model from sklearn
from sklearn.ensemble import ____
# Split your data into training and test set
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=0)
# Define the model as the random forest
model = ____(random_state=5)