1. Nauka
  2. /
  3. Kursy
  4. /
  5. Învățare nesupervizată în Python

Connected

ćwiczenie

Gruparea datelor despre pești

Vei folosi acum pipeline-ul de standardizare și grupare din exercițiul anterior pentru a grupa peștii după măsurătorile lor, apoi vei crea un tabel de contingență pentru a compara etichetele de cluster cu speciile de pești.

Ca și înainte, samples este array-ul 2D cu măsurătorile peștilor. Pipeline-ul tău este disponibil ca pipeline, iar specia fiecărui eșantion de pește este dată de lista species.

Instrukcje

100 XP
  • Importă pandas cu aliasul pd.
  • Antrenează pipeline-ul pe măsurătorile peștilor din samples.
  • Obține etichetele de cluster pentru samples folosind metoda .predict() a obiectului pipeline.
  • Folosind pd.DataFrame(), creează un DataFrame df cu două coloane denumite 'labels' și 'species', folosind respectiv labels și species pentru valorile coloanelor.
  • Folosind pd.crosstab(), creează un tabel de contingență ct din df['labels'] și df['species'].