Impatto delle caratteristiche sulla qualità dei cluster

Esplora come le singole caratteristiche influenzano le prestazioni di clustering di un modello KMeans. L'insieme di dati X è usato per la segmentazione dei clienti in base a tre caratteristiche: reddito, numero di bambini e numero di adolescenti in casa.

La funzione silhouette_score e la variabile column_names sono già state caricate per te.

Questo esercizio fa parte del corso

Explainable AI in Python

Visualizza corso

Istruzioni dell'esercizio

Ricava il silhouette score originale (original_score).
Nel ciclo for, rimuovi le caratteristiche una alla volta e salva il risultato in X_reduced.
Calcola il nuovo silhouette score (new_score).
Calcola l'impact della caratteristica.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive the original silhouette score
original_score = ____

for i in range(X.shape[1]):
  	# Remove feature at index i
    X_reduced = ____
    kmeans.fit(X_reduced)
    # Compute the new silhouette score
    new_score = ____
    # Compute the feature's impact
    impact = ____
    print(f'Feature {column_names[i]}: Impact = {impact}')

Modifica ed esegui il codice