Importanza delle feature nel clustering con ARI
Sfrutta l’Adjusted Rand Index (ARI) per misurare quantitativamente l’impatto della rimozione di ciascuna feature sulle assegnazioni ai cluster nel dataset dei clienti con cui hai lavorato nell’esercizio precedente, già caricato in X.
La funzione adjusted_rand_score() e la variabile column_names sono già state caricate per te.
Questo esercizio fa parte del corso
Explainable AI in Python
Istruzioni dell'esercizio
- Ricava le assegnazioni di cluster originali in
original_clusters. - Nel ciclo for, rimuovi le feature una alla volta e salva il risultato in
X_reduced. - Ricava i
reduced_clustersapplicando K-means aX_reduced. - Calcola l’
importancedella feature in base all’ARI trareduced_clusterseoriginal_clusters.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive original clusters
original_clusters = ____
for i in range(X.shape[1]):
# Remove feature at index i
X_reduced = ____
# Derive reduced clusters
reduced_clusters = ____
# Derive feature importance
importance = ____
print(f'{column_names[i]}: {importance}')