Dimensionamento de dados de peixes para agrupamento
Você recebe uma matriz samples
com as medidas dos peixes. Cada linha é um peixe. As medidas, tipo peso em gramas, comprimento em centímetros e a proporção entre altura e comprimento, têm escalas bem diferentes. Para agrupar esses dados de forma eficaz, você precisa primeiro padronizar esses recursos. Neste exercício, você vai criar um pipeline para padronizar e agrupar os dados.
Esses dados sobre as medidas dos peixes vieram do Journal of Statistics Education.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
Importar:
make_pipeline
desklearn.pipeline
.StandardScaler
desklearn.preprocessing
.KMeans
desklearn.cluster
.
Crie uma instância de
StandardScaler
chamadascaler
.Crie uma instância de
KMeans
com clusters4
chamadoskmeans
.Crie um pipeline chamado “
pipeline
” que conecta “scaler
” e “kmeans
”. Para fazer isso, basta passar esses parâmetros como argumentos paramake_pipeline()
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____
# Create scaler: scaler
scaler = ____
# Create KMeans instance: kmeans
kmeans = ____
# Create pipeline: pipeline
pipeline = ____