LoslegenKostenlos loslegen

Mehrere Kennzahlen nach Sektor und IPO-Jahr berechnen

Die Funktion pointplot() aus seaborn erleichtert den Vergleich von Kennzahlen (Statistiken) einer numerischen Variable über verschiedene Ausprägungen kategorialer Variablen hinweg:

seaborn.pointplot(x=None, y=None, hue=None, data=None, ...)

Im Video hast du eine Visualisierung der Marktkapitalisierung (numerische Variable) gesehen, aufgeteilt danach, ob der IPO (kategoriale Variable) vor (erste Ausprägung) oder nach (zweite Ausprägung) dem Jahr 2000 stattfand.

In dieser Übung vergleichst du die durchschnittliche Marktkapitalisierung seit 2000 für jedes Jahr getrennt nach NYSE und NASDAQ, nachdem Ausreißer oberhalb des 95. Perzentils ausgeschlossen wurden. pandas als pd und matplotlib.pyplot als plt sind importiert, und das DataFrame listings mit der Referenzspalte 'Exchange' steht dir in deinem Workspace zur Verfügung.

Diese Übung ist Teil des Kurses

Importing and Managing Financial Data in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere seaborn als sns.
  • Filtere listings auf Unternehmen mit IPOs nach 2000 von allen Börsen, außer der 'amex'.
  • Konvertiere die Daten in der Spalte 'IPO Year' in ganze Zahlen (Integer).
  • Erstelle die Spalte market_cap_m, die die Marktkapitalisierung in Mio. USD angibt.
  • Filtere market_cap_m, um Werte oberhalb des 95. Perzentils auszuschließen.
  • Erstelle ein pointplot von listings mit der Spalte 'IPO Year' als x, 'market_cap_m' als y und 'Exchange' als hue. Zeige das Ergebnis, nachdem du die xticks um 45 Grad gedreht hast.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import the seaborn library as sns
____

# Exclude IPOs before 2000 and from the 'amex'
listings = ____[(____['IPO Year'] > ____) & (listings.Exchange != ____)]

# Convert IPO Year to integer
listings['IPO Year'] = ____['IPO Year'].____(____)

# Create market_cap_m
listings['market_cap_m'] = ____['Market Capitalization'].div(1e6)

# Exclude outliers
listings = listings[listings.____ < listings.____.____(.95)]

# Create the pointplot
sns.pointplot(x=____, y=____, hue=____, data=____)

# Rotate xticks
plt.____(____=____)

# Show the plot
plt.show()
Code bearbeiten und ausführen