ComeçarComece gratuitamente

Agrupamento de ações usando KMeans

Neste exercício, você agrupará as empresas usando os movimentos diários do preço das ações (ou seja, a diferença em dólares entre os preços de fechamento e de abertura de cada dia de negociação). Você recebe uma matriz NumPy movements de movimentos diários de preços de 2010 a 2015 (obtidos do Yahoo! Finance), em que cada linha corresponde a uma empresa e cada coluna corresponde a um dia de negociação.

Algumas ações são mais caras do que outras. Para levar isso em conta, inclua um Normalizer no início do seu pipeline. O Normalizador transformará separadamente o preço das ações de cada empresa em uma escala relativa antes de iniciar o agrupamento.

Observe que Normalizer() é diferente de StandardScaler(), que você usou no exercício anterior. Enquanto o site StandardScaler() padroniza os recursos (como os recursos dos dados de peixes do exercício anterior) removendo a média e dimensionando a variância da unidade, o site Normalizer() redimensiona cada amostra - aqui, o preço das ações de cada empresa - independentemente da outra.

KMeans e make_pipeline já foram importados para você.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver Curso

Instruções de exercício

  • Importe Normalizer de sklearn.preprocessing.
  • Crie uma instância do site Normalizer chamada normalizer.
  • Crie uma instância de KMeans chamada kmeans com clusters de 10.
  • Usando make_pipeline(), crie um pipeline chamado pipeline que encadeie normalizer e kmeans.
  • Ajuste o pipeline à matriz movements.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import Normalizer
____

# Create a normalizer: normalizer
normalizer = ____

# Create a KMeans model with 10 clusters: kmeans
kmeans = ____

# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____

# Fit pipeline to the daily price movements
____
Editar e executar código