ComeçarComece gratuitamente

Impacto das características na qualidade do cluster

Explore como os recursos individuais afetam o desempenho de agrupamento de um modelo de KMeans. O conjunto de dados X é usado para segmentação de clientes com base em três recursos: renda, número de filhos e número de adolescentes na casa.

A função silhouette_score e a variável column_names foram pré-carregadas para você.

Este exercício faz parte do curso

IA explicável em Python

Ver Curso

Instruções de exercício

  • Derive a pontuação da silhueta original (original_score).
  • No loop for, remova os recursos um a um e salve o resultado em X_reduced.
  • Calcule a nova pontuação da silhueta (new_score).
  • Calcule o impact do recurso.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive the original silhouette score
original_score = ____

for i in range(X.shape[1]):
  	# Remove feature at index i
    X_reduced = ____
    kmeans.fit(X_reduced)
    # Compute the new silhouette score
    new_score = ____
    # Compute the feature's impact
    impact = ____
    print(f'Feature {column_names[i]}: Impact = {impact}')
Editar e executar código