1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Unsupervised Learning in Python

Connected

cvičení

Škálování rybích dat pro shlukování

Máš k dispozici pole samples s měřeními ryb. Každý řádek představuje jednu rybu. Jednotlivá měření – například hmotnost v gramech, délka v centimetrech nebo procentuální poměr výšky k délce – mají velmi odlišné škály. Aby bylo shlukování těchto dat efektivní, je nejprve potřeba tyto příznaky standardizovat. V tomto cvičení sestavíš pipeline, která data standardizuje a poté shlukuje.

Tato data o rybích měřeních pocházejí z Journal of Statistics Education.

Pokyny

100 XP
  • Importuj:
    • make_pipeline z sklearn.pipeline.
    • StandardScaler z sklearn.preprocessing.
    • KMeans z sklearn.cluster.
  • Vytvoř instanci StandardScaler a pojmenuj ji scaler.
  • Vytvoř instanci KMeans se 4 shluky a pojmenuj ji kmeans.
  • Vytvoř pipeline s názvem pipeline, která řetězí scaler a kmeans. Stačí je předat jako argumenty funkci make_pipeline().