Clusterização K-means
Um algoritmo de clusterização muito utilizado é o K-means. Para detecção de fraude, o K-means é simples de implementar e relativamente poderoso para prever casos suspeitos. É um bom algoritmo para começar quando você trabalha com problemas de detecção de fraudes. No entanto, dados de fraude costumam ser muito grandes, especialmente quando você lida com dados de transações. O MiniBatch K-means é uma forma eficiente de implementar K-means em um conjunto de dados grande, e é o que você vai usar neste exercício.
Os dados escalonados do exercício anterior, X_scaled, estão disponíveis. Vamos testar.
Este exercício faz parte do curso
Detecção de Fraudes em Python
Instruções do exercício
- Importe
MiniBatchKMeansdesklearn. - Inicialize o modelo de minibatch kmeans com 8 clusters.
- Ajuste o modelo aos seus dados escalonados.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import MiniBatchKmeans
from sklearn.cluster import ____
# Define the model
kmeans = ____(n_clusters=____, random_state=0)
# Fit the model to the scaled data
kmeans.____(____)