Menerapkan SMOTE

Dalam latihan ini, Anda akan menyeimbangkan kembali data menggunakan Synthetic Minority Over-sampling Technique (SMOTE). Berbeda dengan ROS, SMOTE tidak membuat salinan persis dari observasi, tetapi membuat sampel sintetis baru yang sangat mirip dengan observasi yang ada pada kelas minoritas. Oleh karena itu, SMOTE sedikit lebih canggih daripada sekadar menyalin observasi. Mari terapkan SMOTE pada data kartu kredit kita. Himpunan data df tersedia dan paket yang Anda perlukan untuk SMOTE sudah diimpor. Pada latihan berikutnya, Anda akan memvisualisasikan hasilnya dan membandingkannya dengan data asli agar Anda dapat melihat efek penerapan SMOTE dengan jelas.

Latihan ini merupakan bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Instruksi latihan

Gunakan fungsi prep_data pada df untuk membuat fitur X dan label y.
Definisikan metode penyampelan ulang sebagai SMOTE tipe reguler, di bawah variabel method.
Gunakan .fit_resample() pada X dan y asli untuk memperoleh data hasil penyampelan ulang yang baru.
Plot data hasil penyampelan ulang menggunakan fungsi plot_data().

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

from imblearn.over_sampling import SMOTE

# Run the prep_data function
X, y = ____(df)

# Define the resampling method
method = ____()

# Create the resampled feature set
X_resampled, y_resampled = method.____(____, ____)

# Plot the resampled data
plot_data(____, ____)

Edit dan Jalankan Kode