1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Procvičování otázek k pohovorům z oblasti Machine Learning v Pythonu

Connected

Cvičení

Silhouette metoda

V poslední lekci jsi viděl/a, jak různý počet shluků ovlivňuje výkon algoritmu K-Means. V kontextu pohovoru je to obzvlášť důležité – optimální počet shluků totiž přináší nejlepší výsledky.

V tomto cvičení použiješ funkci silhouette_score() z sklearn.metrics na algoritmy K-Means natrénované na DataFrame diabetes, abys pomocí Silhouette metody našel/a optimální počet shluků. Při výpočtu skóre budeš používat euklidovskou vzdálenost, která zajistí srovnatelnost s metodou Elbow.

Matice příznaků X, kterou použiješ k trénování modelů K-Means, je už připravená.

V pipeline jsi na stejném místě jako v předchozích cvičeních, ale tentokrát přidáš také krok predikce: Machine learning pipeline

Pokyny 1/3

undefined XP
    1
    2
    3
  • Naimportuj potřebné moduly pro vytvoření instance algoritmu K-Means a výpočet jeho silhouette skóre.