Витягування міток кластерів

У попередній вправі ви побачили, що проміжне кластеризування зразків зерна на висоті 6 має 3 кластери. Тепер скористайтеся функцією fcluster(), щоб отримати мітки кластерів для цього проміжного кластеризування, і порівняйте мітки з різновидами зерна за допомогою перехресної таблиці.

Ієрархічне кластеризування вже виконане, а mergings — це результат функції linkage(). Список varieties містить різновид кожного зразка зерна.

Імпортуйте:
- pandas як pd.
- fcluster із scipy.cluster.hierarchy.
Виконайте пласке ієрархічне кластеризування, застосувавши функцію fcluster() до mergings. Задайте максимальну висоту 6 і ключовий аргумент criterion='distance'.
Створіть датафрейм df з двома стовпцями під назвами 'labels' і 'varieties', використавши відповідно labels і varieties як значення стовпців. Це вже зроблено за вас.
Створіть перехресну таблицю ct між df['labels'] і df['varieties'], щоб порахувати, скільки разів кожний різновид зерна збігається з кожною міткою кластера.

Exercice

Витягування міток кластерів

Instructions

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}Exercice

Instructions

Exercice