Importance des caractéristiques dans le regroupement avec ARI
Utilisez l'indice de Rand ajusté (ARI) pour mesurer quantitativement l'impact de la suppression de chaque caractéristique sur les affectations de grappes dans l'ensemble de données client avec lequel vous avez travaillé dans l'exercice précédent, préchargé dans X
.
La fonction adjusted_rand_score()
et la variable column_names
ont été préchargées pour vous.
Cet exercice fait partie du cours
L'IA explicable en Python
Instructions
- Dérivez les affectations originales des grappes dans
original_clusters
. - Dans la boucle for, supprimez les caractéristiques une à une et enregistrez le résultat dans
X_reduced
. - Dérivez le site
reduced_clusters
en appliquant la méthode K-means surX_reduced
. - Calculez la caractéristique
importance
basée sur l'ARI entrereduced_clusters
etoriginal_clusters
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive original clusters
original_clusters = ____
for i in range(X.shape[1]):
# Remove feature at index i
X_reduced = ____
# Derive reduced clusters
reduced_clusters = ____
# Derive feature importance
importance = ____
print(f'{column_names[i]}: {importance}')