Klasifikator Random Forest - bagian 1

Sekarang mari membuat random forest classifier pertama untuk deteksi kecurangan. Semoga Anda dapat melampaui akurasi baseline yang baru saja dihitung, yakni sekitar 96%. Model ini akan menjadi model "baseline" yang akan Anda coba tingkatkan pada latihan berikutnya. Mulailah dengan membagi data menjadi himpunan latih dan uji, serta mendefinisikan model Random Forest. Data yang tersedia adalah fitur X dan label y.

Latihan ini merupakan bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Instruksi latihan

Impor random forest classifier dari sklearn.
Bagi fitur X dan label y Anda menjadi himpunan latih dan uji. Sisihkan himpunan uji sebesar 30%.
Tetapkan random forest classifier ke model dan pertahankan random_state pada 5. Kita perlu menetapkan random state di sini agar dapat membandingkan hasil di berbagai model.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Import the random forest model from sklearn
from sklearn.ensemble import ____

# Split your data into training and test set
X_train, X_test, y_train, y_test = ____(____, ____, test_size=____, random_state=0)

# Define the model as the random forest
model = ____(random_state=5)

Edit dan Jalankan Kode