Visualiseer de IPO-tijdlijn voor alle beurzen met countplot()
Om een basisvisualisatie te maken van het aantal observaties per categorie in een gegevensset, is de functie countplot() van seaborn meestal de juiste keuze:
seaborn.countplot(x=None, hue=None, data=None, ...)
De parameter x bevat de namen van de variabelen in het argument data, de DataFrame die je wilt plotten. Met hue geef je een extra categorische variabele aan via kleur. Dit zijn drie optionele parameters uit de vele die de functie accepteert; voor de volledige lijst kun je de seaborn- documentatie raadplegen.
Laten we dit hulpmiddel gebruiken om de tijdlijn van IPO-activiteit op de drie beurzen te vergelijken. pandas als pd, matplotlib.pyplot als plt en seaborn als sns zijn geïmporteerd, en de DataFrame listings met referentiekolom 'Exchange' is beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Financiële data importeren en beheren in Python
Oefeninstructies
- Filter
listingszodat alleen IPO-jaren na 2000 zijn opgenomen. - Zet de gegevens in de kolom
'IPO Year'om naar gehele getallen. - Maak een
sns.countplot()vanlistingsmet'IPO Year'alsx-variabele en'Exchange'voorhue. - roteer de
xticks()45 graden en toon het resultaat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Select IPOs after 2000
listings = listings[____[____] > ____]
# Convert IPO Year to integer
listings['IPO Year'] = ____[____].____(____)
# Create a countplot
sns.countplot(x=____, hue=____, data=____)
# Rotate xticks and show result
plt.xticks(rotation=45)
# Show the plot
plt.show()