MulaiMulai sekarang secara gratis

Penyesuaian model

Cara sederhana untuk menyesuaikan model random forest agar menangani data kecurangan yang sangat tidak seimbang adalah menggunakan opsi class_weights saat mendefinisikan model sklearn Anda. Namun, seperti yang akan Anda lihat, ini adalah mekanisme yang cukup kasar dan mungkin tidak cocok untuk kasus Anda yang sangat khusus.

Pada latihan ini Anda akan mengeksplorasi mode weight = "balanced_subsample" pada model Random Forest dari latihan sebelumnya. Anda sudah membagi data menjadi himpunan latih dan uji, yaitu X_train, X_test, y_train, y_test sudah tersedia. Fungsi metrik sudah diimpor.

Latihan ini adalah bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Petunjuk latihan

  • Atur argumen class_weight pada classifier Anda menjadi balanced_subsample.
  • Latih model Anda pada himpunan latih.
  • Peroleh prediksi dan probabilitas dari X_test.
  • Dapatkan roc_auc_score, classification report, dan confusion matrix.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Define the model with balanced subsample
model = RandomForestClassifier(class_weight='____', random_state=5)

# Fit your training model to your training set
model.fit(____, ____)

# Obtain the predicted values and probabilities from the model 
predicted = ____.____(____)
probs = ____.____(____)

# Print the roc_auc_score, the classification report and confusion matrix
print(____(____, ____))
print(____(____, ____))
print(____(____, ____))
Edit dan Jalankan Kode