Clustering K-means

Un algoritmo di clustering molto usato è il K-means clustering. Per il fraud detection, K-means è semplice da implementare e relativamente efficace nel prevedere i casi sospetti. È un ottimo punto di partenza quando lavori su problemi di frode. Tuttavia, i dati di frode sono spesso molto grandi, soprattutto quando si tratta di dati di transazione. MiniBatch K-means è un modo efficiente per applicare K-means su un insieme di dati di grandi dimensioni, e lo userai in questo esercizio.

I dati scalati dell’esercizio precedente, X_scaled, sono disponibili. Proviamoci.

Questo esercizio fa parte del corso

Rilevamento delle frodi in Python

Visualizza corso

Istruzioni dell'esercizio

Importa MiniBatchKMeans da sklearn.
Inizializza il modello minibatch k-means con 8 cluster.
Addestra il modello sui dati scalati.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Import MiniBatchKmeans 
from sklearn.cluster import ____

# Define the model 
kmeans = ____(n_clusters=____, random_state=0)

# Fit the model to the scaled data
kmeans.____(____)

Modifica ed esegui il codice