Importancia de las características en los clústeres con ARI
Aprovecha el índice de Rand ajustado (ARI) para medir cuantitativamente el impacto de la eliminación de cada característica en la asignación de clúster en el conjunto de datos de clientes con el que has trabajado en el ejercicio anterior, precargado en X
.
La función adjusted_rand_score()
y la variable column_names
se han precargado para ti.
Este ejercicio forma parte del curso
IA explicable en Python
Instrucciones de ejercicio
- Deduce las asignaciones de clúster originales en
original_clusters
. - En el bucle for, elimina las características una a una y guarda el resultado en
X_reduced
. - Deduce los
reduced_clusters
aplicando k-medias enX_reduced
. - Calcula la característica
importance
basada en ARI entrereduced_clusters
yoriginal_clusters
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive original clusters
original_clusters = ____
for i in range(X.shape[1]):
# Remove feature at index i
X_reduced = ____
# Derive reduced clusters
reduced_clusters = ____
# Derive feature importance
importance = ____
print(f'{column_names[i]}: {importance}')