Klasifikator Random Forest - bagian 1
Sekarang mari membuat random forest classifier pertama untuk deteksi kecurangan. Semoga Anda dapat melampaui akurasi baseline yang baru saja dihitung, yakni sekitar 96%. Model ini akan menjadi model "baseline" yang akan Anda coba tingkatkan pada latihan berikutnya. Mulailah dengan membagi data menjadi himpunan latih dan uji, serta mendefinisikan model Random Forest. Data yang tersedia adalah fitur X dan label y.
Latihan ini adalah bagian dari kursus
Deteksi Kecurangan di Python
Petunjuk latihan
- Impor random forest classifier dari
sklearn. - Bagi fitur
Xdan labelyAnda menjadi himpunan latih dan uji. Sisihkan himpunan uji sebesar 30%. - Tetapkan random forest classifier ke
modeldan pertahankanrandom_statepada 5. Kita perlu menetapkan random state di sini agar dapat membandingkan hasil di berbagai model.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the random forest model from sklearn
from sklearn.ensemble import ____
# Split your data into training and test set
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=0)
# Define the model as the random forest
model = ____(random_state=5)