Comece agoraComece grátis

Clusterização K-means

Um algoritmo de clusterização muito utilizado é o K-means. Para detecção de fraude, o K-means é simples de implementar e relativamente poderoso para prever casos suspeitos. É um bom algoritmo para começar quando você trabalha com problemas de detecção de fraudes. No entanto, dados de fraude costumam ser muito grandes, especialmente quando você lida com dados de transações. O MiniBatch K-means é uma forma eficiente de implementar K-means em um conjunto de dados grande, e é o que você vai usar neste exercício.

Os dados escalonados do exercício anterior, X_scaled, estão disponíveis. Vamos testar.

Este exercicio faz parte do curso

Detecção de Fraudes em Python

Ver curso

Instruções do exercicio

  • Importe MiniBatchKMeans de sklearn.
  • Inicialize o modelo de minibatch kmeans com 8 clusters.
  • Ajuste o modelo aos seus dados escalonados.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Import MiniBatchKmeans 
from sklearn.cluster import ____

# Define the model 
kmeans = ____(n_clusters=____, random_state=0)

# Fit the model to the scaled data
kmeans.____(____)
Editar e Executar Código