Aan de slagGa gratis aan de slag

Mediaan marktkapitalisatie per sector

Geaggregeerde data is data die is samengevoegd uit meerdere metingen. Zoals je in de video hebt gezien, is de functie .groupby() handig om je data te aggregeren op een specifieke categorie.

Je hebt eerder gezien dat de market-capitalizationdata grote uitschieters bevat. Om een robuustere samenvatting te krijgen van de marktwaarde van bedrijven per sector, ga je de mediaan van de marktkapitalisatie per sector berekenen. pandas als pd en matplotlib.pyplot als plt zijn geïmporteerd, en de NYSE-noteringen zijn beschikbaar in je werkruimte als de DataFrame nyse.

Deze oefening maakt deel uit van de cursus

Financiële data importeren en beheren in Python

Cursus bekijken

Oefeninstructies

  • Inspecteer nyse met .info().
  • Maak met broadcasting en .div() een nieuwe kolom market_cap_m die de marktkapitalisatie in miljoenen USD bevat.
  • Laat de kolom 'Market Capitalization' weg met .drop().
  • Pas de methode .groupby() toe op nyse, met 'Sector' als de kolom waarop je groepeert.
  • Bereken de mediaan van de kolom market_cap_m als median_mcap_by_sector.
  • Plot het resultaat als een horizontaal staafdiagram met de titel 'NYSE - Median Market Capitalization'. Gebruik plt.xlabel() met 'USD mn' om een label toe te voegen.
  • Toon het resultaat.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Inspect NYSE data
nyse.____()

# Create market_cap_m
nyse['market_cap_m'] = ____[____].div(1e6)

# Drop market cap column
nyse = ____.____('Market Capitalization', axis=1)

# Group nyse by sector
mcap_by_sector = ____.____(____)

# Calculate median
median_mcap_by_sector = mcap_by_sector.____.____()

# Plot and show as horizontal bar chart
median_mcap_by_sector.plot(____=____, title='NYSE - Median Market Capitalization')

# Add the label
plt.____('USD mn')

# Show the plot
plt.show()
Code bewerken en uitvoeren