1. Apprendre
  2. /
  3. Cours
  4. /
  5. Наглядове навчання в Python

Connected

Exercice

Витягування міток кластерів

У попередній вправі ви побачили, що проміжне кластеризування зразків зерна на висоті 6 має 3 кластери. Тепер скористайтеся функцією fcluster(), щоб отримати мітки кластерів для цього проміжного кластеризування, і порівняйте мітки з різновидами зерна за допомогою перехресної таблиці.

Ієрархічне кластеризування вже виконане, а mergings — це результат функції linkage(). Список varieties містить різновид кожного зразка зерна.

Instructions

100 XP
  • Імпортуйте:
    • pandas як pd.
    • fcluster із scipy.cluster.hierarchy.
  • Виконайте пласке ієрархічне кластеризування, застосувавши функцію fcluster() до mergings. Задайте максимальну висоту 6 і ключовий аргумент criterion='distance'.
  • Створіть датафрейм df з двома стовпцями під назвами 'labels' і 'varieties', використавши відповідно labels і varieties як значення стовпців. Це вже зроблено за вас.
  • Створіть перехресну таблицю ct між df['labels'] і df['varieties'], щоб порахувати, скільки разів кожний різновид зерна збігається з кожною міткою кластера.