Impacto de las características en la calidad del clúster
Explora cómo influyen las características individuales en el rendimiento de los clústeres de un modelo KMeans. El conjunto de datos X
se usa para la segmentación de clientes basada en tres características: ingresos, número de hijos y número de adolescentes en casa.
La función silhouette_score
y la variable column_names
se han precargado para ti.
Este ejercicio forma parte del curso
IA explicable en Python
Instrucciones de ejercicio
- Deduce la puntuación de Silhouette original (
original_score
). - En el bucle for, elimina las características una a una y guarda el resultado en
X_reduced
. - Calcula la nueva puntuación de Silhouette (
new_score
). - Calcula el
impact
de la característica.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive the original silhouette score
original_score = ____
for i in range(X.shape[1]):
# Remove feature at index i
X_reduced = ____
kmeans.fit(X_reduced)
# Compute the new silhouette score
new_score = ____
# Compute the feature's impact
impact = ____
print(f'Feature {column_names[i]}: Impact = {impact}')