Avaliando os menores clusters
Neste exercício, você vai analisar os clusters gerados pelo DBSCAN e marcar certos clusters como fraude:
- primeiro, você precisa descobrir o tamanho dos clusters e filtrar os menores
- depois, você vai pegar os menores e marcar esses como fraude
- por fim, comparar com os rótulos originais para verificar se isso realmente identifica bem as fraudes.
As previsões do modelo DBSCAN estão disponíveis, então n_clusters está disponível, assim como os rótulos de cluster, salvos em pred_labels. Vamos lá!
Este exercício faz parte do curso
Detecção de Fraudes em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])
# Print the result
print(counts)