1. Learn
  2. /
  3. Cursuri
  4. /
  5. Învățare nesupervizată în Python

Connected

exercițiu

Extragerea etichetelor de cluster

În exercițiul anterior, ai văzut că clustering-ul intermediar al eșantioanelor de cereale la înălțimea 6 conține 3 clustere. Acum, folosește funcția fcluster() pentru a extrage etichetele de cluster ale acestui clustering intermediar și compară etichetele cu varietățile de cereale folosind un tabel încrucișat.

Clustering-ul ierarhic a fost deja efectuat, iar mergings este rezultatul funcției linkage(). Lista varieties indică varietatea fiecărui eșantion de cereale.

Instrucțiuni

100 XP
  • Importă:
    • pandas ca pd.
    • fcluster din scipy.cluster.hierarchy.
  • Realizează un clustering ierarhic plat folosind funcția fcluster() aplicată pe mergings. Specifică o înălțime maximă de 6 și argumentul cheie criterion='distance'.
  • Creează un DataFrame df cu două coloane numite 'labels' și 'varieties', folosind labels, respectiv varieties, pentru valorile coloanelor. Acest pas a fost deja realizat pentru tine.
  • Creează un tabel încrucișat ct între df['labels'] și df['varieties'] pentru a număra de câte ori fiecare varietate de cereale coincide cu fiecare etichetă de cluster.