Clusterização K-means

Um algoritmo de clusterização muito utilizado é o K-means. Para detecção de fraude, o K-means é simples de implementar e relativamente poderoso para prever casos suspeitos. É um bom algoritmo para começar quando você trabalha com problemas de detecção de fraudes. No entanto, dados de fraude costumam ser muito grandes, especialmente quando você lida com dados de transações. O MiniBatch K-means é uma forma eficiente de implementar K-means em um conjunto de dados grande, e é o que você vai usar neste exercício.

Os dados escalonados do exercício anterior, X_scaled, estão disponíveis. Vamos testar.

Este exercício faz parte do curso

Detecção de Fraudes em Python

Ver curso

Instruções do exercício

Importe MiniBatchKMeans de sklearn.
Inicialize o modelo de minibatch kmeans com 8 clusters.
Ajuste o modelo aos seus dados escalonados.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import MiniBatchKmeans 
from sklearn.cluster import ____

# Define the model 
kmeans = ____(n_clusters=____, random_state=0)

# Fit the model to the scaled data
kmeans.____(____)

Editar e executar o código