Menerapkan SMOTE
Dalam latihan ini, Anda akan menyeimbangkan kembali data menggunakan Synthetic Minority Over-sampling Technique (SMOTE). Berbeda dengan ROS, SMOTE tidak membuat salinan persis dari observasi, tetapi membuat sampel sintetis baru yang sangat mirip dengan observasi yang ada pada kelas minoritas. Oleh karena itu, SMOTE sedikit lebih canggih daripada sekadar menyalin observasi. Mari terapkan SMOTE pada data kartu kredit kita.
Himpunan data df tersedia dan paket yang Anda perlukan untuk SMOTE sudah diimpor. Pada latihan berikutnya, Anda akan memvisualisasikan hasilnya dan membandingkannya dengan data asli agar Anda dapat melihat efek penerapan SMOTE dengan jelas.
Latihan ini adalah bagian dari kursus
Deteksi Kecurangan di Python
Petunjuk latihan
- Gunakan fungsi
prep_datapadadfuntuk membuat fiturXdan labely. - Definisikan metode penyampelan ulang sebagai SMOTE tipe reguler, di bawah variabel
method. - Gunakan
.fit_resample()padaXdanyasli untuk memperoleh data hasil penyampelan ulang yang baru. - Plot data hasil penyampelan ulang menggunakan fungsi
plot_data().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
from imblearn.over_sampling import SMOTE
# Run the prep_data function
X, y = ____(df)
# Define the resampling method
method = ____()
# Create the resampled feature set
X_resampled, y_resampled = method.____(____, ____)
# Plot the resampled data
plot_data(____, ____)