Bedrijven per sector op alle beurzen

Een categorische variabele is een variabele die één van een beperkt aantal waarden aanneemt op basis van een kwalitatieve eigenschap. Een frequentieverdeling laat zien hoe vaak elke waarde van een categorische variabele voorkomt.

Denk terug aan de beursdata uit de eerdere hoofdstukken. De functie .mean() helpt niet om de frequentie van 'Sector'-waarden zoals 'Technology' en 'Finance' te begrijpen, terwijl .value_counts() en .nunique() dat wel doen.

In deze oefening vergelijk je de verdeling van noteringen op de AMEX, NASDAQ en NYSE per sector. pandas als pd en matplotlib.pyplot als plt zijn al geïmporteerd, en de noteringsinformatie uit eerdere oefeningen is geladen in een dictionary listings waarvan de keys 'amex', 'nasdaq' en 'nyse' zijn.

Deze oefening maakt deel uit van de cursus

Financiële data importeren en beheren in Python

Bekijk cursus

Oefeninstructies

Maak een lijst exchanges met exact de strings van de namen van de beurzen in de volgorde hierboven.
Gebruik een for-lus om over exchanges te itereren met een iteratorvariabele exchange die de naam van elke beurs bevat. Voer in elke iteratie het volgende uit:
- Pas .value_counts() toe op 'Sector' en sla het resultaat op in sectors.
- Sorteer sectors aflopend en plot ze in een staafdiagram.
- Laat het resultaat zien.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create the list exchanges
exchanges = [____, ____, ____]

# Iterate over exchanges then plot and show result
for ____ in exchanges:
    sectors = listings[____].____.____()
    # Sort in descending order and plot
    sectors.sort_values(____=____).plot(____=____)
    # Show the plot
    plt.show()

Code bewerken en uitvoeren