MulaiMulai sekarang secara gratis

Menerapkan SMOTE

Dalam latihan ini, Anda akan menyeimbangkan kembali data menggunakan Synthetic Minority Over-sampling Technique (SMOTE). Berbeda dengan ROS, SMOTE tidak membuat salinan persis dari observasi, tetapi membuat sampel sintetis baru yang sangat mirip dengan observasi yang ada pada kelas minoritas. Oleh karena itu, SMOTE sedikit lebih canggih daripada sekadar menyalin observasi. Mari terapkan SMOTE pada data kartu kredit kita. Himpunan data df tersedia dan paket yang Anda perlukan untuk SMOTE sudah diimpor. Pada latihan berikutnya, Anda akan memvisualisasikan hasilnya dan membandingkannya dengan data asli agar Anda dapat melihat efek penerapan SMOTE dengan jelas.

Latihan ini adalah bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Petunjuk latihan

  • Gunakan fungsi prep_data pada df untuk membuat fitur X dan label y.
  • Definisikan metode penyampelan ulang sebagai SMOTE tipe reguler, di bawah variabel method.
  • Gunakan .fit_resample() pada X dan y asli untuk memperoleh data hasil penyampelan ulang yang baru.
  • Plot data hasil penyampelan ulang menggunakan fungsi plot_data().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

from imblearn.over_sampling import SMOTE

# Run the prep_data function
X, y = ____(df)

# Define the resampling method
method = ____()

# Create the resampled feature set
X_resampled, y_resampled = method.____(____, ____)

# Plot the resampled data
plot_data(____, ____)
Edit dan Jalankan Kode