ComenzarEmpieza gratis

Impacto de las características en la calidad del clúster

Explora cómo influyen las características individuales en el rendimiento de los clústeres de un modelo KMeans. El conjunto de datos X se usa para la segmentación de clientes basada en tres características: ingresos, número de hijos y número de adolescentes en casa.

La función silhouette_score y la variable column_names se han precargado para ti.

Este ejercicio forma parte del curso

IA explicable en Python

Ver curso

Instrucciones de ejercicio

  • Deduce la puntuación de Silhouette original (original_score).
  • En el bucle for, elimina las características una a una y guarda el resultado en X_reduced.
  • Calcula la nueva puntuación de Silhouette (new_score).
  • Calcula el impact de la característica.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive the original silhouette score
original_score = ____

for i in range(X.shape[1]):
  	# Remove feature at index i
    X_reduced = ____
    kmeans.fit(X_reduced)
    # Compute the new silhouette score
    new_score = ____
    # Compute the feature's impact
    impact = ____
    print(f'Feature {column_names[i]}: Impact = {impact}')
Editar y ejecutar código