Importancia de las características en los clústeres con ARI

Aprovecha el índice de Rand ajustado (ARI) para medir cuantitativamente el impacto de la eliminación de cada característica en la asignación de clúster en el conjunto de datos de clientes con el que has trabajado en el ejercicio anterior, precargado en X.

La función adjusted_rand_score() y la variable column_names se han precargado para ti.

Este ejercicio forma parte del curso

IA explicable en Python

Ver curso

Instrucciones del ejercicio

Deduce las asignaciones de clúster originales en original_clusters.
En el bucle for, elimina las características una a una y guarda el resultado en X_reduced.
Deduce los reduced_clusters aplicando k-medias en X_reduced.
Calcula la característica importance basada en ARI entre reduced_clusters y original_clusters.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive original clusters
original_clusters = ____

for i in range(X.shape[1]):
  	# Remove feature at index i
    X_reduced = ____
    # Derive reduced clusters
    reduced_clusters = ____
    # Derive feature importance
    importance = ____
    print(f'{column_names[i]}: {importance}')

Editar y ejecutar código