Clustering K-means
Un algoritmo di clustering molto usato è il K-means clustering. Per il fraud detection, K-means è semplice da implementare e relativamente efficace nel prevedere i casi sospetti. È un ottimo punto di partenza quando lavori su problemi di frode. Tuttavia, i dati di frode sono spesso molto grandi, soprattutto quando si tratta di dati di transazione. MiniBatch K-means è un modo efficiente per applicare K-means su un insieme di dati di grandi dimensioni, e lo userai in questo esercizio.
I dati scalati dell’esercizio precedente, X_scaled, sono disponibili. Proviamoci.
Questo esercizio fa parte del corso
Rilevamento delle frodi in Python
Istruzioni dell'esercizio
- Importa
MiniBatchKMeansdasklearn. - Inizializza il modello minibatch k-means con 8 cluster.
- Addestra il modello sui dati scalati.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import MiniBatchKmeans
from sklearn.cluster import ____
# Define the model
kmeans = ____(n_clusters=____, random_state=0)
# Fit the model to the scaled data
kmeans.____(____)