1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Unsupervised Learning in Python

Connected

cvičení

Shlukování dat o rybách

Teď využiješ pipeline pro standardizaci a shlukování z předchozího cvičení k rozdělení ryb do clusterů podle jejich měření a poté vytvoříš křížovou tabulku, která porovná štítky clusterů s druhy ryb.

Jako dříve, samples je 2D pole měření ryb. Pipeline máš k dispozici jako pipeline a druh každé ryby je uložen v seznamu species.

Pokyny

100 XP
  • Importuj pandas jako pd.
  • Natrénuj pipeline na měřeních ryb samples.
  • Získej štítky clusterů pro samples pomocí metody .predict() objektu pipeline.
  • Pomocí pd.DataFrame() vytvoř DataFrame df se dvěma sloupci pojmenovanými 'labels' a 'species', přičemž jako hodnoty sloupců použij labels a species.
  • Pomocí pd.crosstab() vytvoř křížovou tabulku ct z df['labels'] a df['species'].