Unternehmen pro Sektor auf allen Börsen
Eine kategorische Variable ist eine Variable, die aufgrund einer qualitativen Eigenschaft nur eine begrenzte Anzahl von Werten annehmen kann. Eine Häufigkeitsverteilung stellt dar, wie oft eine Ausprägung einer kategorialen Variable vorkommt.
Denk an die Börsendaten aus den früheren Kapiteln zurück. Die Funktion .mean() hilft wenig, um die Häufigkeit von 'Sector'-Werten wie 'Technology' und 'Finance' zu verstehen – .value_counts() und .nunique() dagegen schon.
In dieser Übung vergleichst du die Verteilung der Listings an AMEX, NASDAQ und NYSE pro Sektor. pandas als pd und matplotlib.pyplot als plt wurden importiert, und die Listings-Informationen aus den vorherigen Übungen wurden in ein Dictionary listings geladen, dessen Keys 'amex', 'nasdaq' und 'nyse' sind.
Diese Übung ist Teil des Kurses
Importing and Managing Financial Data in Python
Anleitung zur Übung
- Erstelle eine Liste
exchanges, die die exakten Strings der Börsennamen in der oben genannten Reihenfolge enthält. - Verwende eine for-Schleife, um über
exchangeszu iterieren, mit der Iterator-Variableexchange, die jeweils den Namen der Börse enthält. In jeder Iteration:- Wende
.value_counts()auf'Sector'an und weise das Ergebnissectorszu. - Sortiere
sectorsabsteigend und stelle sie in einem Balkendiagramm dar. - Zeige das Ergebnis an.
- Wende
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create the list exchanges
exchanges = [____, ____, ____]
# Iterate over exchanges then plot and show result
for ____ in exchanges:
sectors = listings[____].____.____()
# Sort in descending order and plot
sectors.sort_values(____=____).plot(____=____)
# Show the plot
plt.show()