Agrupando ações usando KMeans
Neste exercício, você vai agrupar empresas usando os movimentos diários dos preços das ações delas (ou seja, a diferença em dólares entre os preços de fechamento e abertura de cada dia de negociação). Você tem uma matriz NumPy movements
com os movimentos diários dos preços de 2010 a 2015 (obtidos no Yahoo! Finanças), onde cada linha é uma empresa e cada coluna é um dia de negociação.
Algumas ações são mais caras do que outras. Para resolver isso, inclua um “ Normalizer
” no começo do seu pipeline. O Normalizador vai transformar separadamente o preço das ações de cada empresa para uma escala relativa antes de começar o agrupamento.
Lembre-se que Normalizer()
é diferente de StandardScaler()
, que você usou no exercício anterior. Enquanto StandardScaler()
padroniza as características (como as características dos dados sobre peixes do exercício anterior) removendo a média e escalando para a variância unitária, Normalizer()
reescala cada amostra — aqui, o preço das ações de cada empresa — independentemente das outras.
KMeans
e make_pipeline
já foram importados pra você.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Importe
Normalizer
desklearn.preprocessing
. - Crie uma instância de
Normalizer
chamadanormalizer
. - Crie uma instância de
KMeans
chamadakmeans
com clusters10
. - Usando
make_pipeline()
, crie um pipeline chamadopipeline
que encadeianormalizer
ekmeans
. - Ajuste o pipeline à matriz de e
movements
.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import Normalizer
____
# Create a normalizer: normalizer
normalizer = ____
# Create a KMeans model with 10 clusters: kmeans
kmeans = ____
# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____
# Fit pipeline to the daily price movements
____