Importância dos recursos no agrupamento com ARI
Aproveite o Índice de Rand Ajustado (ARI) para medir quantitativamente o impacto da remoção de cada recurso nas atribuições de cluster no conjunto de dados do cliente com o qual você trabalhou no exercício anterior, pré-carregado em X
.
A função adjusted_rand_score()
e a variável column_names
foram pré-carregadas para você.
Este exercício faz parte do curso
IA explicável em Python
Instruções de exercício
- Derive as atribuições de cluster originais em
original_clusters
. - No loop for, remova os recursos um a um e salve o resultado em
X_reduced
. - Derive os
reduced_clusters
aplicando o K-means emX_reduced
. - Calcule o recurso
importance
com base em ARI entrereduced_clusters
eoriginal_clusters
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive original clusters
original_clusters = ____
for i in range(X.shape[1]):
# Remove feature at index i
X_reduced = ____
# Derive reduced clusters
reduced_clusters = ____
# Derive feature importance
importance = ____
print(f'{column_names[i]}: {importance}')