Agrupamento de ações usando KMeans
Neste exercício, você agrupará as empresas usando os movimentos diários do preço das ações (ou seja, a diferença em dólares entre os preços de fechamento e de abertura de cada dia de negociação). Você recebe uma matriz NumPy movements de movimentos diários de preços de 2010 a 2015 (obtidos do Yahoo! Finance), em que cada linha corresponde a uma empresa e cada coluna corresponde a um dia de negociação.
Algumas ações são mais caras do que outras. Para levar isso em conta, inclua um Normalizer no início do seu pipeline. O Normalizador transformará separadamente o preço das ações de cada empresa em uma escala relativa antes de iniciar o agrupamento.
Observe que Normalizer() é diferente de StandardScaler(), que você usou no exercício anterior. Enquanto o site StandardScaler() padroniza os recursos (como os recursos dos dados de peixes do exercício anterior) removendo a média e dimensionando a variância da unidade, o site Normalizer() redimensiona cada amostra - aqui, o preço das ações de cada empresa - independentemente da outra.
KMeans e make_pipeline já foram importados para você.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Importe
Normalizerdesklearn.preprocessing. - Crie uma instância do site
Normalizerchamadanormalizer. - Crie uma instância de
KMeanschamadakmeanscom clusters de10. - Usando
make_pipeline(), crie um pipeline chamadopipelineque encadeienormalizerekmeans. - Ajuste o pipeline à matriz
movements.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import Normalizer
____
# Create a normalizer: normalizer
normalizer = ____
# Create a KMeans model with 10 clusters: kmeans
kmeans = ____
# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____
# Fit pipeline to the daily price movements
____