Impacto das características na qualidade do cluster
Explore como os recursos individuais afetam o desempenho de agrupamento de um modelo de KMeans. O conjunto de dados X
é usado para segmentação de clientes com base em três recursos: renda, número de filhos e número de adolescentes na casa.
A função silhouette_score
e a variável column_names
foram pré-carregadas para você.
Este exercício faz parte do curso
IA explicável em Python
Instruções de exercício
- Derive a pontuação da silhueta original (
original_score
). - No loop for, remova os recursos um a um e salve o resultado em
X_reduced
. - Calcule a nova pontuação da silhueta (
new_score
). - Calcule o
impact
do recurso.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive the original silhouette score
original_score = ____
for i in range(X.shape[1]):
# Remove feature at index i
X_reduced = ____
kmeans.fit(X_reduced)
# Compute the new silhouette score
new_score = ____
# Compute the feature's impact
impact = ____
print(f'Feature {column_names[i]}: Impact = {impact}')