Agrupamento dos dados de peixes
Agora você usará o pipeline de padronização e agrupamento do exercício anterior para agrupar os peixes de acordo com suas medidas e, em seguida, criará uma tabulação cruzada para comparar os rótulos dos agrupamentos com as espécies de peixes.
Como antes, samples é a matriz 2D de medições de peixes. Seu pipeline está disponível em pipeline, e as espécies de cada amostra de peixe são fornecidas pela lista species.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Importe
pandascomopd. - Ajuste a tubulação às medidas do peixe
samples. - Obtenha os rótulos de cluster para
samplesusando o método.predict()depipeline. - Usando
pd.DataFrame(), crie um DataFramedfcom duas colunas denominadas'labels'e'species', usandolabelsespecies, respectivamente, para os valores das colunas. - Usando
pd.crosstab(), crie uma tabulação cruzadactdedf['labels']edf['species'].
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import pandas
import pandas as pd
# Fit the pipeline to samples
____
# Calculate the cluster labels: labels
labels = ____
# Create a DataFrame with labels and species as columns: df
df = ____
# Create crosstab: ct
ct = ____
# Display ct
print(ct)