1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Unsupervised Learning in Python

Connected

cvičení

Extrakce štítků shluků

V předchozím cvičení jsi viděl/a, že mezilehlé shlukování vzorků zrní ve výšce 6 obsahuje 3 shluky. Teď použij funkci fcluster() k extrakci štítků shluků pro toto mezilehlé shlukování a porovnej štítky s odrůdami zrní pomocí křížové tabulky.

Hierarchické shlukování už bylo provedeno a mergings je výsledek funkce linkage(). Seznam varieties udává odrůdu každého vzorku zrní.

Pokyny

100 XP
  • Importuj:
    • pandas jako pd.
    • fcluster z scipy.cluster.hierarchy.
  • Proveď flat hierarchické shlukování pomocí funkce fcluster() na mergings. Zadej maximální výšku 6 a klíčový argument criterion='distance'.
  • Vytvoř DataFrame df se dvěma sloupci pojmenovanými 'labels' a 'varieties', přičemž jako hodnoty sloupců použij labels a varieties. Tento krok už byl proveden za tebe.
  • Vytvoř křížovou tabulku ct mezi df['labels'] a df['varieties'], která spočítá, kolikrát se každá odrůda zrní shoduje s každým štítkem shluku.