Aan de slagGa gratis aan de slag

Alle samenvattende statistieken per sector

Je kunt de verschillende samenvattende statistieken die je in het vorige hoofdstuk hebt gezien toepassen op een groupby-object om het resultaat per categorie te krijgen. Dit omvat ook de functie .describe(), die in één keer meerdere inzichten geeft!

Hier ga je dit oefenen met de NASDAQ-noteringen. pandas is geïmporteerd als pd, en de gegevens van de NASDAQ-effectennoteringen zijn beschikbaar in je werkruimte in de DataFrame nasdaq.

Deze oefening maakt deel uit van de cursus

Financiële data importeren en beheren in Python

Cursus bekijken

Oefeninstructies

  • Inspecteer de nasdaq-gegevens met .info().
  • Maak een nieuwe kolom market_cap_m met de marktkapitalisatie in miljoenen USD. Verwijder op de volgende regel de kolom 'Market Capitalization'.
  • Groepeer je nasdaq-gegevens op 'Sector' en ken dit toe aan nasdaq_by_sector.
  • Roep de methode .describe() aan op nasdaq_by_sector, ken dit toe aan summary, en print het resultaat.
  • Dit werkt, maar result staat in long-formaat en gebruikt een pd.MultiIndex() die je eerder hebt gezien. Zet summary om naar wide-formaat door .unstack() aan te roepen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Inspect NASDAQ data
nasdaq.____()

# Create market_cap_m
nasdaq['market_cap_m'] = ____[____].div(1e6)

# Drop the Market Capitalization column
nasdaq.drop('Market Capitalization', axis=1, inplace=True)

# Group nasdaq by Sector
nasdaq_by_sector = ____.____(____)

# Create summary statistics by sector
summary = ____.____()

# Print the summary
print(summary)

# Unstack 
summary = ____.____()

# Print the summary again
print(summary)
Code bewerken en uitvoeren