Agrupando ações usando KMeans
Neste exercício, você vai agrupar empresas usando os movimentos diários dos preços das ações delas (ou seja, a diferença em dólares entre os preços de fechamento e abertura de cada dia de negociação). Você tem uma matriz NumPy movements com os movimentos diários dos preços de 2010 a 2015 (obtidos no Yahoo! Finanças), onde cada linha é uma empresa e cada coluna é um dia de negociação.
Algumas ações são mais caras do que outras. Para resolver isso, inclua um “ Normalizer ” no começo do seu pipeline. O Normalizador vai transformar separadamente o preço das ações de cada empresa para uma escala relativa antes de começar o agrupamento.
Lembre-se que Normalizer() é diferente de StandardScaler(), que você usou no exercício anterior. Enquanto StandardScaler() padroniza as características (como as características dos dados sobre peixes do exercício anterior) removendo a média e escalando para a variância unitária, Normalizer() reescala cada amostra — aqui, o preço das ações de cada empresa — independentemente das outras.
KMeans e make_pipeline já foram importados pra você.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Importe
Normalizerdesklearn.preprocessing. - Crie uma instância de
Normalizerchamadanormalizer. - Crie uma instância de
KMeanschamadakmeanscom clusters10. - Usando
make_pipeline(), crie um pipeline chamadopipelineque encadeianormalizerekmeans. - Ajuste o pipeline à matriz de e
movements.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import Normalizer
____
# Create a normalizer: normalizer
normalizer = ____
# Create a KMeans model with 10 clusters: kmeans
kmeans = ____
# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____
# Fit pipeline to the daily price movements
____