Hierarquias de estoques
No capítulo 1, você usou o k-means clustering para agrupar empresas de acordo com os movimentos do preço das ações. Agora, você executará o agrupamento hierárquico das empresas. Você recebe uma matriz NumPy de movimentos de preços movements
, em que as linhas correspondem às empresas, e uma lista dos nomes das empresas companies
. O agrupamento hierárquico do SciPy não se encaixa em um pipeline do sklearn, portanto, você precisará usar a função normalize()
de sklearn.preprocessing
em vez de Normalizer
.
linkage
e dendrogram
já foram importados de scipy.cluster.hierarchy
, e o PyPlot foi importado como plt
.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções de exercício
- Importe
normalize
desklearn.preprocessing
. - Redimensione os movimentos de preço de cada ação usando a função
normalize()
emmovements
. - Aplique a função
linkage()
anormalized_movements
, usando a ligação'complete'
, para calcular o agrupamento hierárquico. Atribua o resultado amergings
. - Trace um dendrograma do agrupamento hierárquico, usando a lista
companies
de nomes de empresas comolabels
. Além disso, especifique os argumentos de palavra-chaveleaf_rotation=90
eleaf_font_size=6
como você fez no exercício anterior.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import normalize
____
# Normalize the movements: normalized_movements
normalized_movements = ____
# Calculate the linkage: mergings
mergings = ____
# Plot the dendrogram
____
plt.show()