1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie nienadzorowane w Pythonie

Connected

ćwiczenie

Wyodrębnianie etykiet klastrów

W poprzednim ćwiczeniu widziałeś, że pośrednie grupowanie próbek zboża na wysokości 6 daje 3 klastry. Teraz użyj funkcji fcluster(), aby wyodrębnić etykiety klastrów dla tego pośredniego grupowania, a następnie porównaj je z odmianami zbóż za pomocą tabeli krzyżowej.

Grupowanie hierarchiczne zostało już wykonane, a mergings przechowuje wynik funkcji linkage(). Lista varieties zawiera odmianę każdej próbki zboża.

Instrukcje

100 XP
  • Zaimportuj:
    • pandas jako pd.
    • fcluster z scipy.cluster.hierarchy.
  • Wykonaj płaskie grupowanie hierarchiczne, wywołując funkcję fcluster() na obiekcie mergings. Podaj maksymalną wysokość 6 oraz argument kluczowy criterion='distance'.
  • Utwórz DataFrame df z dwiema kolumnami o nazwach 'labels' i 'varieties', używając odpowiednio labels i varieties jako wartości kolumn. Ten krok został już za ciebie wykonany.
  • Utwórz tabelę krzyżową ct na podstawie df['labels'] i df['varieties'], aby policzyć, ile razy każda odmiana zboża pokrywa się z każdą etykietą klastra.