Bedrijven per sector op alle beurzen
Een categorische variabele is een variabele die één van een beperkt aantal waarden aanneemt op basis van een kwalitatieve eigenschap. Een frequentieverdeling laat zien hoe vaak elke waarde van een categorische variabele voorkomt.
Denk terug aan de beursdata uit de eerdere hoofdstukken. De functie .mean() helpt niet om de frequentie van 'Sector'-waarden zoals 'Technology' en 'Finance' te begrijpen, terwijl .value_counts() en .nunique() dat wel doen.
In deze oefening vergelijk je de verdeling van noteringen op de AMEX, NASDAQ en NYSE per sector. pandas als pd en matplotlib.pyplot als plt zijn al geïmporteerd, en de noteringsinformatie uit eerdere oefeningen is geladen in een dictionary listings waarvan de keys 'amex', 'nasdaq' en 'nyse' zijn.
Deze oefening maakt deel uit van de cursus
Financiële data importeren en beheren in Python
Oefeninstructies
- Maak een lijst
exchangesmet exact de strings van de namen van de beurzen in de volgorde hierboven. - Gebruik een for-lus om over
exchangeste itereren met een iteratorvariabeleexchangedie de naam van elke beurs bevat. Voer in elke iteratie het volgende uit:- Pas
.value_counts()toe op'Sector'en sla het resultaat op insectors. - Sorteer
sectorsaflopend en plot ze in een staafdiagram. - Laat het resultaat zien.
- Pas
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the list exchanges
exchanges = [____, ____, ____]
# Iterate over exchanges then plot and show result
for ____ in exchanges:
sectors = listings[____].____.____()
# Sort in descending order and plot
sectors.sort_values(____=____).plot(____=____)
# Show the plot
plt.show()