1. Learn
  2. /
  3. Courses
  4. /
  5. Oövervakad inlärning i Python

Connected

Exercise

Klustra fiskdata

Nu ska du använda din standardiserings- och klustrings-pipeline från föregående övning för att klustra fiskarna utifrån deras mätningar och sedan skapa en korstabell för att jämföra klusteretiketterna med fiskarternas namn.

Precis som tidigare är samples en tvådimensionell array med fiskmätningar. Din pipeline finns tillgänglig som pipeline, och arten för varje fiskprov anges av listan species.

Instructions

100 XP
  • Importera pandas som pd.
  • Anpassa pipelinen till fiskmätningarna samples.
  • Hämta klusteretiketterna för samples med .predict()-metoden på pipeline.
  • Skapa en DataFrame df med pd.DataFrame() som innehåller två kolumner med namnen 'labels' och 'species', där du använder labels respektive species som kolumnvärden.
  • Skapa en korstabell ct av df['labels'] och df['species'] med hjälp av pd.crosstab().