ComeçarComece de graça

Agrupamento dos dados de peixes

Agora você usará o pipeline de padronização e agrupamento do exercício anterior para agrupar os peixes de acordo com suas medidas e, em seguida, criará uma tabulação cruzada para comparar os rótulos dos agrupamentos com as espécies de peixes.

Como antes, samples é a matriz 2D de medições de peixes. Seu pipeline está disponível em pipeline, e as espécies de cada amostra de peixe são fornecidas pela lista species.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver curso

Instruções do exercício

  • Importe pandas como pd.
  • Ajuste a tubulação às medidas do peixe samples.
  • Obtenha os rótulos de cluster para samples usando o método .predict() de pipeline.
  • Usando pd.DataFrame(), crie um DataFrame df com duas colunas denominadas 'labels' e 'species', usando labels e species, respectivamente, para os valores das colunas.
  • Usando pd.crosstab(), crie uma tabulação cruzada ct de df['labels'] e df['species'].

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import pandas
import pandas as pd

# Fit the pipeline to samples
____

# Calculate the cluster labels: labels
labels = ____

# Create a DataFrame with labels and species as columns: df
df = ____

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Editar e executar o código