CommencerCommencer gratuitement

Impact des caractéristiques sur la qualité des grappes

Étudiez l'impact des caractéristiques individuelles sur les performances de regroupement d'un modèle KMeans. L'ensemble de données X est utilisé pour la segmentation de la clientèle sur la base de trois caractéristiques : le revenu, le nombre d'enfants et le nombre d'adolescents à la maison.

La fonction silhouette_score et la variable column_names ont été préchargées pour vous.

Cet exercice fait partie du cours

L'IA explicable en Python

Afficher le cours

Instructions

  • Déterminer le score de la silhouette originale (original_score).
  • Dans la boucle for, supprimez les caractéristiques une à une et enregistrez le résultat dans X_reduced.
  • Calculez le nouveau score de la silhouette (new_score).
  • Calculez l'adresse impact de l'élément.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

kmeans = KMeans(n_clusters=5, random_state=10, n_init=10).fit(X)
# Derive the original silhouette score
original_score = ____

for i in range(X.shape[1]):
  	# Remove feature at index i
    X_reduced = ____
    kmeans.fit(X_reduced)
    # Compute the new silhouette score
    new_score = ____
    # Compute the feature's impact
    impact = ____
    print(f'Feature {column_names[i]}: Impact = {impact}')
Modifier et exécuter le code