Hierarquias de estoques
No capítulo 1, você usou o k-means clustering para agrupar empresas de acordo com os movimentos do preço das ações. Agora, você executará o agrupamento hierárquico das empresas. Você recebe uma matriz NumPy de movimentos de preços movements, em que as linhas correspondem às empresas, e uma lista dos nomes das empresas companies. O agrupamento hierárquico do SciPy não se encaixa em um pipeline do sklearn, portanto, você precisará usar a função normalize() de sklearn.preprocessing em vez de Normalizer.
linkage e dendrogram já foram importados de scipy.cluster.hierarchy, e o PyPlot foi importado como plt.
Este exercício faz parte do curso
Aprendizado não supervisionado em Python
Instruções do exercício
- Importe
normalizedesklearn.preprocessing. - Redimensione os movimentos de preço de cada ação usando a função
normalize()emmovements. - Aplique a função
linkage()anormalized_movements, usando a ligação'complete', para calcular o agrupamento hierárquico. Atribua o resultado amergings. - Trace um dendrograma do agrupamento hierárquico, usando a lista
companiesde nomes de empresas comolabels. Além disso, especifique os argumentos de palavra-chaveleaf_rotation=90eleaf_font_size=6como você fez no exercício anterior.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import normalize
____
# Normalize the movements: normalized_movements
normalized_movements = ____
# Calculate the linkage: mergings
mergings = ____
# Plot the dendrogram
____
plt.show()