ComeçarComece de graça

Agrupando ações usando KMeans

Neste exercício, você vai agrupar empresas usando os movimentos diários dos preços das ações delas (ou seja, a diferença em dólares entre os preços de fechamento e abertura de cada dia de negociação). Você tem uma matriz NumPy movements com os movimentos diários dos preços de 2010 a 2015 (obtidos no Yahoo! Finanças), onde cada linha é uma empresa e cada coluna é um dia de negociação.

Algumas ações são mais caras do que outras. Para resolver isso, inclua um “ Normalizer ” no começo do seu pipeline. O Normalizador vai transformar separadamente o preço das ações de cada empresa para uma escala relativa antes de começar o agrupamento.

Lembre-se que Normalizer() é diferente de StandardScaler(), que você usou no exercício anterior. Enquanto StandardScaler() padroniza as características (como as características dos dados sobre peixes do exercício anterior) removendo a média e escalando para a variância unitária, Normalizer() reescala cada amostra — aqui, o preço das ações de cada empresa — independentemente das outras.

KMeans e make_pipeline já foram importados pra você.

Este exercício faz parte do curso

Aprendizado não supervisionado em Python

Ver curso

Instruções do exercício

  • Importe Normalizer de sklearn.preprocessing.
  • Crie uma instância de Normalizer chamada normalizer.
  • Crie uma instância de KMeans chamada kmeans com clusters 10.
  • Usando make_pipeline(), crie um pipeline chamado pipeline que encadeia normalizer e kmeans.
  • Ajuste o pipeline à matriz de e movements.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Import Normalizer
____

# Create a normalizer: normalizer
normalizer = ____

# Create a KMeans model with 10 clusters: kmeans
kmeans = ____

# Make a pipeline chaining normalizer and kmeans: pipeline
pipeline = ____

# Fit pipeline to the daily price movements
____
Editar e executar o código