ComeçarComece de graça

Dimensionamento de dados de peixes para agrupamento

Você recebe uma matriz samples com as medidas dos peixes. Cada linha é um peixe. As medidas, tipo peso em gramas, comprimento em centímetros e a proporção entre altura e comprimento, têm escalas bem diferentes. Para agrupar esses dados de forma eficaz, você precisa primeiro padronizar esses recursos. Neste exercício, você vai criar um pipeline para padronizar e agrupar os dados.

Esses dados sobre as medidas dos peixes vieram do Journal of Statistics Education.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver curso

Instruções do exercício

  • Importar:

    • make_pipeline de sklearn.pipeline.

    • StandardScaler de sklearn.preprocessing.

    • KMeans de sklearn.cluster.

  • Crie uma instância de StandardScaler chamada scaler.

  • Crie uma instância de KMeans com clusters 4 chamados kmeans.

  • Crie um pipeline chamado “ pipeline ” que conecta “ scaler ” e “ kmeans ”. Para fazer isso, basta passar esses parâmetros como argumentos para make_pipeline().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____

# Create scaler: scaler
scaler = ____

# Create KMeans instance: kmeans
kmeans = ____

# Create pipeline: pipeline
pipeline = ____
Editar e executar o código