ComeçarComece de graça

Agrupando os dados dos peixes

Agora você vai usar o pipeline de padronização e agrupamento do exercício anterior para agrupar os peixes de acordo com suas medidas e, em seguida, criar uma tabulação cruzada para comparar os rótulos dos agrupamentos com as espécies de peixes.

Como antes, samples é a matriz 2D das medidas dos peixes. Seu pipeline tá disponível em pipeline, e as espécies de cada amostra de peixe estão na lista species.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver curso

Instruções do exercício

  • Importe pandas como pd.
  • Ajuste o tubo às medidas do peixe samples.
  • Pegue os rótulos do cluster para samples usando o método .predict() de pipeline.
  • Usando pd.DataFrame(), crie um DataFrame df com duas colunas chamadas 'labels' e 'species', usando labels e species, respectivamente, para os valores das colunas.
  • Usando pd.crosstab(), crie uma tabulação cruzada ct de df['labels'] e df['species'].

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import pandas
import pandas as pd

# Fit the pipeline to samples
____

# Calculate the cluster labels: labels
labels = ____

# Create a DataFrame with labels and species as columns: df
df = ____

# Create crosstab: ct
ct = ____

# Display ct
print(ct)
Editar e executar o código