Wyodrębnianie etykiet klastrów

W poprzednim ćwiczeniu widziałeś, że pośrednie grupowanie próbek zboża na wysokości 6 daje 3 klastry. Teraz użyj funkcji fcluster(), aby wyodrębnić etykiety klastrów dla tego pośredniego grupowania, a następnie porównaj je z odmianami zbóż za pomocą tabeli krzyżowej.

Grupowanie hierarchiczne zostało już wykonane, a mergings przechowuje wynik funkcji linkage(). Lista varieties zawiera odmianę każdej próbki zboża.

Zaimportuj:
- pandas jako pd.
- fcluster z scipy.cluster.hierarchy.
Wykonaj płaskie grupowanie hierarchiczne, wywołując funkcję fcluster() na obiekcie mergings. Podaj maksymalną wysokość 6 oraz argument kluczowy criterion='distance'.
Utwórz DataFrame df z dwiema kolumnami o nazwach 'labels' i 'varieties', używając odpowiednio labels i varieties jako wartości kolumn. Ten krok został już za ciebie wykonany.
Utwórz tabelę krzyżową ct na podstawie df['labels'] i df['varieties'], aby policzyć, ile razy każda odmiana zboża pokrywa się z każdą etykietą klastra.

ćwiczenie

Wyodrębnianie etykiet klastrów

Instrukcje

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje

ćwiczenie