Entreprises par secteur sur toutes les places boursières
Une variable catégorielle est une variable qui peut prendre un nombre limité de valeurs fondées sur une propriété qualitative. Une distribution de fréquences représente le nombre de fois où une valeur d’une variable catégorielle apparaît.
Repensez aux données des places boursières des chapitres précédents. La fonction .mean() n’est pas très utile pour comprendre la fréquence des valeurs de 'Sector' comme 'Technology' et 'Finance', alors que .value_counts() et .nunique() le sont.
Dans cet exercice, vous allez comparer la distribution des sociétés cotées sur l’AMEX, le NASDAQ et le NYSE par secteur. pandas sous pd et matplotlib.pyplot sous plt ont été importés, et les informations de cotation des exercices précédents ont été chargées dans un dictionnaire listings dont les clés sont 'amex', 'nasdaq' et 'nyse'.
Cet exercice fait partie du cours
Importer et gérer des données financières en Python
Instructions
- Créez une liste
exchangescontenant exactement les chaînes de caractères des noms des places boursières dans l’ordre indiqué ci-dessus. - Utilisez une boucle for pour itérer sur
exchangesavec une variable d’itérationexchangequi contient le nom de chaque place. À chaque itération :- Appliquez
.value_counts()à'Sector'et affectez le résultat àsectors. - Triez
sectorspar ordre décroissant et tracez-les dans un diagramme en barres. - Affichez le résultat.
- Appliquez
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the list exchanges
exchanges = [____, ____, ____]
# Iterate over exchanges then plot and show result
for ____ in exchanges:
sectors = listings[____].____.____()
# Sort in descending order and plot
sectors.sort_values(____=____).plot(____=____)
# Show the plot
plt.show()