CommencerCommencer gratuitement

Importance des caractéristiques dans le regroupement avec ARI

Utilisez l'indice de Rand ajusté (ARI) pour mesurer quantitativement l'impact de la suppression de chaque caractéristique sur les affectations de grappes dans l'ensemble de données client avec lequel vous avez travaillé dans l'exercice précédent, préchargé dans X.

La fonction adjusted_rand_score() et la variable column_names ont été préchargées pour vous.

Cet exercice fait partie du cours

L'IA explicable en Python

Afficher le cours

Instructions

  • Dérivez les affectations originales des grappes dans original_clusters.
  • Dans la boucle for, supprimez les caractéristiques une à une et enregistrez le résultat dans X_reduced.
  • Dérivez le site reduced_clusters en appliquant la méthode K-means sur X_reduced.
  • Calculez la caractéristique importance basée sur l'ARI entre reduced_clusters et original_clusters.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive original clusters
original_clusters = ____

for i in range(X.shape[1]):
  	# Remove feature at index i
    X_reduced = ____
    # Derive reduced clusters
    reduced_clusters = ____
    # Derive feature importance
    importance = ____
    print(f'{column_names[i]}: {importance}')
Modifier et exécuter le code