Quelles actions évoluent de manière similaire ?
Dans l'exercice précédent, vous avez regroupé des entreprises en fonction de l'évolution quotidienne du cours de leurs actions. Quelles sont donc les entreprises dont les cours boursiers ont tendance à évoluer de la même manière ? Vous allez maintenant examiner les étiquettes des clusters de votre clustering pour le découvrir.
Votre solution à l'exercice précédent a déjà été exécutée. Rappelons que vous avez construit un pipeline pipeline
contenant un modèle KMeans
et que vous l'avez ajusté au tableau NumPy movements
des fluctuations quotidiennes des actions. De plus, une liste companies
des noms des entreprises est disponible.
Cet exercice fait partie du cours
Apprentissage non supervisé en Python
Instructions
- Importez
pandas
en tant quepd
. - Utilisez la méthode «
.predict()
» du pipeline pour prédire les étiquettes pour «movements
». - Alignez les étiquettes des clusters avec la liste des noms d'entreprises
companies
en créant un DataFramedf
aveclabels
etcompanies
comme colonnes. Cela a été fait pour vous. - Utilisez la méthode
.sort_values()
dedf
pour trier le DataFrame selon la colonne'labels'
, puis affichez le résultat. - Cliquez sur « Soumettre » et prenez un moment pour découvrir quelles entreprises sont regroupées dans chaque cluster.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import pandas
import pandas as pd
# Predict the cluster labels: labels
labels = ____
# Create a DataFrame aligning labels and companies: df
df = pd.DataFrame({'labels': labels, 'companies': companies})
# Display df sorted by cluster label
print(____)