Impact des caractéristiques sur la qualité des grappes
Étudiez l'impact des caractéristiques individuelles sur les performances de regroupement d'un modèle KMeans. L'ensemble de données X
est utilisé pour la segmentation de la clientèle sur la base de trois caractéristiques : le revenu, le nombre d'enfants et le nombre d'adolescents à la maison.
La fonction silhouette_score
et la variable column_names
ont été préchargées pour vous.
Cet exercice fait partie du cours
L'IA explicable en Python
Instructions
- Déterminer le score de la silhouette originale (
original_score
). - Dans la boucle for, supprimez les caractéristiques une à une et enregistrez le résultat dans
X_reduced
. - Calculez le nouveau score de la silhouette (
new_score
). - Calculez l'adresse
impact
de l'élément.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive the original silhouette score
original_score = ____
for i in range(X.shape[1]):
# Remove feature at index i
X_reduced = ____
kmeans.fit(X_reduced)
# Compute the new silhouette score
new_score = ____
# Compute the feature's impact
impact = ____
print(f'Feature {column_names[i]}: Impact = {impact}')