ComeçarComece gratuitamente

Dimensionamento de dados de peixes para agrupamento

Você recebe uma matriz samples com medidas de peixes. Cada linha representa um peixe individual. As medidas, como o peso em gramas, o comprimento em centímetros e a proporção percentual da altura em relação ao comprimento, têm escalas muito diferentes. Para agrupar esses dados de forma eficaz, você precisará padronizar esses recursos primeiro. Neste exercício, você criará um pipeline para padronizar e agrupar os dados.

Esses dados de medição de peixes foram obtidos do Journal of Statistics Education.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver Curso

Instruções de exercício

  • Importação:

    • make_pipeline de sklearn.pipeline.

    • StandardScaler de sklearn.preprocessing.

    • KMeans de sklearn.cluster.

  • Crie uma instância do site StandardScaler chamada scaler.

  • Crie uma instância de KMeans com clusters 4 chamados kmeans.

  • Crie um pipeline chamado pipeline que encadeie scaler e kmeans. Para fazer isso, você só precisa passá-los como argumentos para make_pipeline().

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____

# Create scaler: scaler
scaler = ____

# Create KMeans instance: kmeans
kmeans = ____

# Create pipeline: pipeline
pipeline = ____
Editar e executar código