Škálování rybích dat pro shlukování

Máš k dispozici pole samples s měřeními ryb. Každý řádek představuje jednu rybu. Jednotlivá měření – například hmotnost v gramech, délka v centimetrech nebo procentuální poměr výšky k délce – mají velmi odlišné škály. Aby bylo shlukování těchto dat efektivní, je nejprve potřeba tyto příznaky standardizovat. V tomto cvičení sestavíš pipeline, která data standardizuje a poté shlukuje.

Tato data o rybích měřeních pocházejí z Journal of Statistics Education.

Importuj:
- make_pipeline z sklearn.pipeline.
- StandardScaler z sklearn.preprocessing.
- KMeans z sklearn.cluster.
Vytvoř instanci StandardScaler a pojmenuj ji scaler.
Vytvoř instanci KMeans se 4 shluky a pojmenuj ji kmeans.
Vytvoř pipeline s názvem pipeline, která řetězí scaler a kmeans. Stačí je předat jako argumenty funkci make_pipeline().

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}cvičení

Pokyny

cvičení