Bereken meerdere statistieken per sector en IPO-jaar
De functie pointplot() van seaborn maakt het makkelijk om samenvattende statistieken van een numerieke variabele te vergelijken voor verschillende niveaus van categorische variabelen:
seaborn.pointplot(x=None, y=None, hue=None, data=None, ...)
In de video zag je een visualisatie van de marktkapitalisatie (de numerieke variabele), uitgesplitst naar of de IPO (de categorische variabele) vóór (eerste niveau) of na (tweede niveau) het jaar 2000 plaatsvond.
In deze oefening vergelijk je de gemiddelde marktkapitalisatie per jaar sinds 2000 voor de NYSE en de NASDAQ, nadat je uitschieters boven het 95e percentiel hebt verwijderd. pandas als pd en matplotlib.pyplot als plt zijn geïmporteerd, en de DataFrame listings met referentiekolom 'Exchange' is beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Financiële data importeren en beheren in Python
Oefeninstructies
- Importeer
seabornalssns. - Filter
listingszodat je bedrijven overhoudt met IPO's na 2000 van alle beurzen, behalve de'amex'. - Zet de gegevens in kolom
'IPO Year'om naar gehele getallen. - Maak de kolom
market_cap_mom de marktkapitalisatie in USD miljoen uit te drukken. - Filter
market_cap_mom waarden boven het 95e percentiel uit te sluiten. - Maak een
pointplotvanlistingsmet de kolom'IPO Year'voorx,'market_cap_m'vooryen'Exchange'voorhue. Laat het resultaat zien nadat je dexticks45 graden hebt gedraaid.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the seaborn library as sns
____
# Exclude IPOs before 2000 and from the 'amex'
listings = ____[(____['IPO Year'] > ____) & (listings.Exchange != ____)]
# Convert IPO Year to integer
listings['IPO Year'] = ____['IPO Year'].____(____)
# Create market_cap_m
listings['market_cap_m'] = ____['Market Capitalization'].div(1e6)
# Exclude outliers
listings = listings[listings.____ < listings.____.____(.95)]
# Create the pointplot
sns.pointplot(x=____, y=____, hue=____, data=____)
# Rotate xticks
plt.____(____=____)
# Show the plot
plt.show()