Applicare SMOTE

In questo esercizio, riequilibrerai i dati usando la Synthetic Minority Over-sampling Technique (SMOTE). A differenza di ROS, SMOTE non crea copie esatte delle osservazioni, ma genera nuovi campioni sintetici molto simili alle osservazioni esistenti della classe minoritaria. SMOTE è quindi un po' più sofisticato del semplice copiare osservazioni, quindi applichiamolo ai nostri dati delle carte di credito. Il dataset df è disponibile e i pacchetti necessari per SMOTE sono già importati. Nel prossimo esercizio visualizzerai il risultato e lo confronterai con i dati originali, così potrai vedere chiaramente l'effetto dell'applicazione di SMOTE.

Questo esercizio fa parte del corso

Rilevamento delle frodi in Python

Visualizza corso

Istruzioni dell'esercizio

Usa la funzione prep_data su df per creare le feature X e le etichette y.
Definisci il metodo di ricampionamento come SMOTE standard, nella variabile method.
Usa .fit_resample() sugli X e y originali per ottenere i nuovi dati ricampionati.
Traccia i dati ricampionati usando la funzione plot_data().

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

from imblearn.over_sampling import SMOTE

# Run the prep_data function
X, y = ____(df)

# Define the resampling method
method = ____()

# Create the resampled feature set
X_resampled, y_resampled = method.____(____, ____)

# Plot the resampled data
plot_data(____, ____)

Modifica ed esegui il codice