1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování otázek k pohovorům z oblasti Machine Learning v Pythonu

Connected

Cvičení

Hierarchické aglomerativní shlukování

V předchozím cvičení jsi viděl/a, jak může počet shluků při K-means shlukování ovlivnit výsledky, a naučil/a ses, jak o K-means mluvit při pohovoru z oblasti Machine Learning. Další model shlukování, který můžeš použít, je hierarchické aglomerativní shlukování. V Pythonu lze optimální počet shluků pro tuto techniku určit jak vizuálně, tak matematicky – k tomu využiješ moduly scipy a sklearn.

Měj na paměti, že výběr optimálního počtu shluků z dendrogramu závisí na kritériu propojení i na prahové vzdálenosti. Vytvoříš dendrogram z matice X datasetu diabetes, pak si představ imaginární přímku na úrovni 1,50 a spočítej, kolik svislých čar přetíná – to ti dá optimální počet shluků pro tvůj hierarchický shlukovací algoritmus.

Pokyny 1/4

undefined XP
    1
    2
    3
    4
  • Naimportuj potřebné balíčky pro vytvoření dendrogramu a provedení aglomerativního hierarchického shlukování.