Alle samenvattende statistieken per sector

Je kunt de verschillende samenvattende statistieken die je in het vorige hoofdstuk hebt gezien toepassen op een groupby-object om het resultaat per categorie te krijgen. Dit omvat ook de functie .describe(), die in één keer meerdere inzichten geeft!

Hier ga je dit oefenen met de NASDAQ-noteringen. pandas is geïmporteerd als pd, en de gegevens van de NASDAQ-effectennoteringen zijn beschikbaar in je werkruimte in de DataFrame nasdaq.

Deze oefening maakt deel uit van de cursus

Financiële data importeren en beheren in Python

Bekijk cursus

Oefeninstructies

Inspecteer de nasdaq-gegevens met .info().
Maak een nieuwe kolom market_cap_m met de marktkapitalisatie in miljoenen USD. Verwijder op de volgende regel de kolom 'Market Capitalization'.
Groepeer je nasdaq-gegevens op 'Sector' en ken dit toe aan nasdaq_by_sector.
Roep de methode .describe() aan op nasdaq_by_sector, ken dit toe aan summary, en print het resultaat.
Dit werkt, maar result staat in long-formaat en gebruikt een pd.MultiIndex() die je eerder hebt gezien. Zet summary om naar wide-formaat door .unstack() aan te roepen.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Inspect NASDAQ data
nasdaq.____()

# Create market_cap_m
nasdaq['market_cap_m'] = ____[____].div(1e6)

# Drop the Market Capitalization column
nasdaq.drop('Market Capitalization', axis=1, inplace=True)

# Group nasdaq by Sector
nasdaq_by_sector = ____.____(____)

# Create summary statistics by sector
summary = ____.____()

# Print the summary
print(summary)

# Unstack 
summary = ____.____()

# Print the summary again
print(summary)

Code bewerken en uitvoeren