Impatto delle caratteristiche sulla qualità dei cluster
Esplora come le singole caratteristiche influenzano le prestazioni di clustering di un modello KMeans. L'insieme di dati X è usato per la segmentazione dei clienti in base a tre caratteristiche: reddito, numero di bambini e numero di adolescenti in casa.
La funzione silhouette_score e la variabile column_names sono già state caricate per te.
Questo esercizio fa parte del corso
Explainable AI in Python
Istruzioni dell'esercizio
- Ricava il silhouette score originale (
original_score). - Nel ciclo for, rimuovi le caratteristiche una alla volta e salva il risultato in
X_reduced. - Calcola il nuovo silhouette score (
new_score). - Calcola l'
impactdella caratteristica.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive the original silhouette score
original_score = ____
for i in range(X.shape[1]):
# Remove feature at index i
X_reduced = ____
kmeans.fit(X_reduced)
# Compute the new silhouette score
new_score = ____
# Compute the feature's impact
impact = ____
print(f'Feature {column_names[i]}: Impact = {impact}')