Importância dos recursos no agrupamento com ARI

Aproveite o Índice de Rand Ajustado (ARI) para medir quantitativamente o impacto da remoção de cada recurso nas atribuições de cluster no conjunto de dados do cliente com o qual você trabalhou no exercício anterior, pré-carregado em X.

A função adjusted_rand_score() e a variável column_names foram pré-carregadas para você.

Este exercicio faz parte do curso

IA explicável em Python

Ver curso

Instruções do exercicio

Derive as atribuições de cluster originais em original_clusters.
No loop for, remova os recursos um a um e salve o resultado em X_reduced.
Derive os reduced_clusters aplicando o K-means em X_reduced.
Calcule o recurso importance com base em ARI entre reduced_clusters e original_clusters.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive original clusters
original_clusters = ____

for i in range(X.shape[1]):
  	# Remove feature at index i
    X_reduced = ____
    # Derive reduced clusters
    reduced_clusters = ____
    # Derive feature importance
    importance = ____
    print(f'{column_names[i]}: {importance}')

Editar e Executar Código