Agrupamento de ações usando KMeans
Neste exercício, você agrupará as empresas usando os movimentos diários do preço das ações (ou seja, a diferença em dólares entre os preços de fechamento e de abertura de cada dia de negociação). Você recebe uma matriz NumPy movements
de movimentos diários de preços de 2010 a 2015 (obtidos do Yahoo! Finance), em que cada linha corresponde a uma empresa e cada coluna corresponde a um dia de negociação.
Algumas ações são mais caras do que outras. Para levar isso em conta, inclua um Normalizer
no início do seu pipeline. O Normalizador transformará separadamente o preço das ações de cada empresa em uma escala relativa antes de iniciar o agrupamento.
Observe que Normalizer()
é diferente de StandardScaler()
, que você usou no exercício anterior. Enquanto o site StandardScaler()
padroniza os recursos (como os recursos dos dados de peixes do exercício anterior) removendo a média e dimensionando a variância da unidade, o site Normalizer()
redimensiona cada amostra - aqui, o preço das ações de cada empresa - independentemente da outra.
KMeans
e make_pipeline
já foram importados para você.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções de exercício
- Importe
Normalizer
desklearn.preprocessing
. - Crie uma instância do site
Normalizer
chamadanormalizer
. - Crie uma instância de
KMeans
chamadakmeans
com clusters de10
. - Usando
make_pipeline()
, crie um pipeline chamadopipeline
que encadeienormalizer
ekmeans
. - Ajuste o pipeline à matriz
movements
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import Normalizer
____
# Create a normalizer: normalizer
normalizer = ____
# Create a KMeans model with 10 clusters: kmeans
kmeans = ____
# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____
# Fit pipeline to the daily price movements
____