K-means-clustering

Een veelgebruikt clustering-algoritme is K-means-clustering. Voor fraudedetectie is K-means-clustering eenvoudig te implementeren en redelijk krachtig in het voorspellen van verdachte gevallen. Het is een goed algoritme om mee te beginnen bij fraudedetectieproblemen. Fraudedata is echter vaak erg groot, zeker wanneer je met transactiegegevens werkt. MiniBatch K-means is een efficiënte manier om K-means toe te passen op een grote gegevensset; die gebruik je in deze oefening.

De geschaalde data uit de vorige oefening, X_scaled, is beschikbaar. Laten we het proberen.

Deze oefening maakt deel uit van de cursus

Fraudedetectie in Python

Bekijk cursus

Oefeninstructies

Importeer MiniBatchKMeans uit sklearn.
Initialiseer het minibatch kmeans-model met 8 clusters.
Train het model op je geschaalde data.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Import MiniBatchKmeans 
from sklearn.cluster import ____

# Define the model 
kmeans = ____(n_clusters=____, random_state=0)

# Fit the model to the scaled data
kmeans.____(____)

Code bewerken en uitvoeren