Agrupando os dados dos peixes
Agora você vai usar o pipeline de padronização e agrupamento do exercício anterior para agrupar os peixes de acordo com suas medidas e, em seguida, criar uma tabulação cruzada para comparar os rótulos dos agrupamentos com as espécies de peixes.
Como antes, samples
é a matriz 2D das medidas dos peixes. Seu pipeline tá disponível em pipeline
, e as espécies de cada amostra de peixe estão na lista species
.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Importe
pandas
comopd
. - Ajuste o tubo às medidas do peixe
samples
. - Pegue os rótulos do cluster para
samples
usando o método.predict()
depipeline
. - Usando
pd.DataFrame()
, crie um DataFramedf
com duas colunas chamadas'labels'
e'species'
, usandolabels
especies
, respectivamente, para os valores das colunas. - Usando
pd.crosstab()
, crie uma tabulação cruzadact
dedf['labels']
edf['species']
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import pandas
import pandas as pd
# Fit the pipeline to samples
____
# Calculate the cluster labels: labels
labels = ____
# Create a DataFrame with labels and species as columns: df
df = ____
# Create crosstab: ct
ct = ____
# Display ct
print(ct)