Alle samenvattende statistieken per sector
Je kunt de verschillende samenvattende statistieken die je in het vorige hoofdstuk hebt gezien toepassen op een groupby-object om het resultaat per categorie te krijgen. Dit omvat ook de functie .describe(), die in één keer meerdere inzichten geeft!
Hier ga je dit oefenen met de NASDAQ-noteringen. pandas is geïmporteerd als pd, en de gegevens van de NASDAQ-effectennoteringen zijn beschikbaar in je werkruimte in de DataFrame nasdaq.
Deze oefening maakt deel uit van de cursus
Financiële data importeren en beheren in Python
Oefeninstructies
- Inspecteer de
nasdaq-gegevens met.info(). - Maak een nieuwe kolom
market_cap_mmet de marktkapitalisatie in miljoenen USD. Verwijder op de volgende regel de kolom'Market Capitalization'. - Groepeer je
nasdaq-gegevens op'Sector'en ken dit toe aannasdaq_by_sector. - Roep de methode
.describe()aan opnasdaq_by_sector, ken dit toe aansummary, en print het resultaat. - Dit werkt, maar
resultstaat in long-formaat en gebruikt eenpd.MultiIndex()die je eerder hebt gezien. Zetsummaryom naar wide-formaat door.unstack()aan te roepen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Inspect NASDAQ data
nasdaq.____()
# Create market_cap_m
nasdaq['market_cap_m'] = ____[____].div(1e6)
# Drop the Market Capitalization column
nasdaq.drop('Market Capitalization', axis=1, inplace=True)
# Group nasdaq by Sector
nasdaq_by_sector = ____.____(____)
# Create summary statistics by sector
summary = ____.____()
# Print the summary
print(summary)
# Unstack
summary = ____.____()
# Print the summary again
print(summary)