Entreprises par secteur sur toutes les places boursières

Une variable catégorielle est une variable qui peut prendre un nombre limité de valeurs fondées sur une propriété qualitative. Une distribution de fréquences représente le nombre de fois où une valeur d’une variable catégorielle apparaît.

Repensez aux données des places boursières des chapitres précédents. La fonction .mean() n’est pas très utile pour comprendre la fréquence des valeurs de 'Sector' comme 'Technology' et 'Finance', alors que .value_counts() et .nunique() le sont.

Dans cet exercice, vous allez comparer la distribution des sociétés cotées sur l’AMEX, le NASDAQ et le NYSE par secteur. pandas sous pd et matplotlib.pyplot sous plt ont été importés, et les informations de cotation des exercices précédents ont été chargées dans un dictionnaire listings dont les clés sont 'amex', 'nasdaq' et 'nyse'.

Cet exercice fait partie du cours

<cours>Importer et gérer des données financières en Python</cours>

Voir le cours

Instructions de l’exercice

Créez une liste exchanges contenant exactement les chaînes de caractères des noms des places boursières dans l’ordre indiqué ci-dessus.
Utilisez une boucle for pour itérer sur exchanges avec une variable d’itération exchange qui contient le nom de chaque place. À chaque itération :
- Appliquez .value_counts() à 'Sector' et affectez le résultat à sectors.
- Triez sectors par ordre décroissant et tracez-les dans un diagramme en barres.
- Affichez le résultat.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Create the list exchanges
exchanges = [____, ____, ____]

# Iterate over exchanges then plot and show result
for ____ in exchanges:
    sectors = listings[____].____.____()
    # Sort in descending order and plot
    sectors.sort_values(____=____).plot(____=____)
    # Show the plot
    plt.show()

Modifier et exécuter le code