Penyesuaian model

Cara sederhana untuk menyesuaikan model random forest agar menangani data kecurangan yang sangat tidak seimbang adalah menggunakan opsi class_weights saat mendefinisikan model sklearn Anda. Namun, seperti yang akan Anda lihat, ini adalah mekanisme yang cukup kasar dan mungkin tidak cocok untuk kasus Anda yang sangat khusus.

Pada latihan ini Anda akan mengeksplorasi mode weight = "balanced_subsample" pada model Random Forest dari latihan sebelumnya. Anda sudah membagi data menjadi himpunan latih dan uji, yaitu X_train, X_test, y_train, y_test sudah tersedia. Fungsi metrik sudah diimpor.

Latihan ini merupakan bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Instruksi latihan

Atur argumen class_weight pada classifier Anda menjadi balanced_subsample.
Latih model Anda pada himpunan latih.
Peroleh prediksi dan probabilitas dari X_test.
Dapatkan roc_auc_score, classification report, dan confusion matrix.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Define the model with balanced subsample
model = RandomForestClassifier(class_weight='____', random_state=5)

# Fit your training model to your training set
model.fit(____, ____)

# Obtain the predicted values and probabilities from the model 
predicted = ____.____(____)
probs = ____.____(____)

# Print the roc_auc_score, the classification report and confusion matrix
print(____(____, ____))
print(____(____, ____))
print(____(____, ____))

Edit dan Jalankan Kode