Dimensionamento de dados de peixes para agrupamento
Você recebe uma matriz samples
com medidas de peixes. Cada linha representa um peixe individual. As medidas, como o peso em gramas, o comprimento em centímetros e a proporção percentual da altura em relação ao comprimento, têm escalas muito diferentes. Para agrupar esses dados de forma eficaz, você precisará padronizar esses recursos primeiro. Neste exercício, você criará um pipeline para padronizar e agrupar os dados.
Esses dados de medição de peixes foram obtidos do Journal of Statistics Education.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções de exercício
Importação:
make_pipeline
desklearn.pipeline
.StandardScaler
desklearn.preprocessing
.KMeans
desklearn.cluster
.
Crie uma instância do site
StandardScaler
chamadascaler
.Crie uma instância de
KMeans
com clusters4
chamadoskmeans
.Crie um pipeline chamado
pipeline
que encadeiescaler
ekmeans
. Para fazer isso, você só precisa passá-los como argumentos paramake_pipeline()
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Perform the necessary imports
from ____ import ____
from ____ import ____
from ____ import ____
# Create scaler: scaler
scaler = ____
# Create KMeans instance: kmeans
kmeans = ____
# Create pipeline: pipeline
pipeline = ____