Dimensionamento de dados de peixes para agrupamento
Você recebe uma matriz samples com medidas de peixes. Cada linha representa um peixe individual. As medidas, como o peso em gramas, o comprimento em centímetros e a proporção percentual da altura em relação ao comprimento, têm escalas muito diferentes. Para agrupar esses dados de forma eficaz, você precisará padronizar esses recursos primeiro. Neste exercício, você criará um pipeline para padronizar e agrupar os dados.
Esses dados de medição de peixes foram obtidos do Journal of Statistics Education.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
Importação:
make_pipelinedesklearn.pipeline.StandardScalerdesklearn.preprocessing.KMeansdesklearn.cluster.
Crie uma instância do site
StandardScalerchamadascaler.Crie uma instância de
KMeanscom clusters4chamadoskmeans.Crie um pipeline chamado
pipelineque encadeiescalerekmeans. Para fazer isso, você só precisa passá-los como argumentos paramake_pipeline().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____
# Create scaler: scaler
scaler = ____
# Create KMeans instance: kmeans
kmeans = ____
# Create pipeline: pipeline
pipeline = ____