1. Learn
  2. /
  3. Cursuri
  4. /
  5. AI Explicabil în Python

Connected

exercițiu

Importanța caracteristicilor în clustering cu ARI

Folosește Adjusted Rand Index (ARI) pentru a măsura cantitativ impactul eliminării fiecărei caracteristici asupra atribuirilor de cluster în setul de date despre clienți cu care ai lucrat în exercițiul anterior, pre-încărcat în X.

Funcția adjusted_rand_score() și variabila column_names sunt deja pre-încărcate.

Instrucțiuni

100 XP
  • Determină atribuirile originale de cluster în original_clusters.
  • În bucla for, elimină caracteristicile una câte una și salvează rezultatul în X_reduced.
  • Obține reduced_clusters aplicând K-means pe X_reduced.
  • Calculează importance pentru fiecare caracteristică pe baza ARI dintre reduced_clusters și original_clusters.