ComeçarComece de graça

Avaliando os menores clusters

Neste exercício, você vai analisar os clusters gerados pelo DBSCAN e marcar certos clusters como fraude:

  • primeiro, você precisa descobrir o tamanho dos clusters e filtrar os menores
  • depois, você vai pegar os menores e marcar esses como fraude
  • por fim, comparar com os rótulos originais para verificar se isso realmente identifica bem as fraudes.

As previsões do modelo DBSCAN estão disponíveis, então n_clusters está disponível, assim como os rótulos de cluster, salvos em pred_labels. Vamos lá!

Este exercício faz parte do curso

Detecção de Fraudes em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Count observations in each cluster number
counts = np.bincount(____[____ >= 0])

# Print the result
print(counts)
Editar e executar o código