IniziaInizia gratis

Importanza delle feature nel clustering con ARI

Sfrutta l’Adjusted Rand Index (ARI) per misurare quantitativamente l’impatto della rimozione di ciascuna feature sulle assegnazioni ai cluster nel dataset dei clienti con cui hai lavorato nell’esercizio precedente, già caricato in X.

La funzione adjusted_rand_score() e la variabile column_names sono già state caricate per te.

Questo esercizio fa parte del corso

Explainable AI in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Ricava le assegnazioni di cluster originali in original_clusters.
  • Nel ciclo for, rimuovi le feature una alla volta e salva il risultato in X_reduced.
  • Ricava i reduced_clusters applicando K-means a X_reduced.
  • Calcola l’importance della feature in base all’ARI tra reduced_clusters e original_clusters.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive original clusters
original_clusters = ____

for i in range(X.shape[1]):
  	# Remove feature at index i
    X_reduced = ____
    # Derive reduced clusters
    reduced_clusters = ____
    # Derive feature importance
    importance = ____
    print(f'{column_names[i]}: {importance}')
Modifica ed esegui il codice