Agrupando os dados dos peixes
Agora você vai usar o pipeline de padronização e agrupamento do exercício anterior para agrupar os peixes de acordo com suas medidas e, em seguida, criar uma tabulação cruzada para comparar os rótulos dos agrupamentos com as espécies de peixes.
Como antes, samples é a matriz 2D das medidas dos peixes. Seu pipeline tá disponível em pipeline, e as espécies de cada amostra de peixe estão na lista species.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Importe
pandascomopd. - Ajuste o tubo às medidas do peixe
samples. - Pegue os rótulos do cluster para
samplesusando o método.predict()depipeline. - Usando
pd.DataFrame(), crie um DataFramedfcom duas colunas chamadas'labels'e'species', usandolabelsespecies, respectivamente, para os valores das colunas. - Usando
pd.crosstab(), crie uma tabulação cruzadactdedf['labels']edf['species'].
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import pandas
import pandas as pd
# Fit the pipeline to samples
____
# Calculate the cluster labels: labels
labels = ____
# Create a DataFrame with labels and species as columns: df
df = ____
# Create crosstab: ct
ct = ____
# Display ct
print(ct)