Mediaan marktkapitalisatie per sector
Geaggregeerde data is data die is samengevoegd uit meerdere metingen. Zoals je in de video hebt gezien, is de functie .groupby() handig om je data te aggregeren op een specifieke categorie.
Je hebt eerder gezien dat de market-capitalizationdata grote uitschieters bevat. Om een robuustere samenvatting te krijgen van de marktwaarde van bedrijven per sector, ga je de mediaan van de marktkapitalisatie per sector berekenen. pandas als pd en matplotlib.pyplot als plt zijn geïmporteerd, en de NYSE-noteringen zijn beschikbaar in je werkruimte als de DataFrame nyse.
Deze oefening maakt deel uit van de cursus
Financiële data importeren en beheren in Python
Oefeninstructies
- Inspecteer
nysemet.info(). - Maak met broadcasting en
.div()een nieuwe kolommarket_cap_mdie de marktkapitalisatie in miljoenen USD bevat. - Laat de kolom
'Market Capitalization'weg met.drop(). - Pas de methode
.groupby()toe opnyse, met'Sector'als de kolom waarop je groepeert. - Bereken de mediaan van de kolom
market_cap_malsmedian_mcap_by_sector. - Plot het resultaat als een horizontaal staafdiagram met de titel
'NYSE - Median Market Capitalization'. Gebruikplt.xlabel()met'USD mn'om een label toe te voegen. - Toon het resultaat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Inspect NYSE data
nyse.____()
# Create market_cap_m
nyse['market_cap_m'] = ____[____].div(1e6)
# Drop market cap column
nyse = ____.____('Market Capitalization', axis=1)
# Group nyse by sector
mcap_by_sector = ____.____(____)
# Calculate median
median_mcap_by_sector = mcap_by_sector.____.____()
# Plot and show as horizontal bar chart
median_mcap_by_sector.plot(____=____, title='NYSE - Median Market Capitalization')
# Add the label
plt.____('USD mn')
# Show the plot
plt.show()