Bereken meerdere kengetallen per sector en beurs
Met de functie .agg() kun je je data op nog meer manieren aggregeren. Door een lijst met namen van statistische methoden mee te geven, bereken je meerdere samenvattingsstatistieken tegelijk. Je kunt nieuwe namen aan de geaggregeerde kolommen geven met de methode rename, die een dictionary-argument verwacht waarbij de keys de namen zijn van de berekende metrics en de values de gewenste nieuwe namen.
In deze oefening bereken je het gemiddelde, de mediaan en de standaarddeviatie van de marktkapitalisatie in miljoenen USD. pandas als pd en matplotlib.pyplot als plt zijn geïmporteerd, en de DataFrame listings, met referentiekolom 'Exchange', is beschikbaar in je werkruimte.
Deze oefening maakt deel uit van de cursus
Financiële data importeren en beheren in Python
Oefeninstructies
- Maak met broadcasting en
.div()een nieuwe kolom'market_cap_m'met de marktkapitalisatie in miljoenen USD. - Groepeer je data op zowel
'Sector'als'Exchange'en ken het resultaat toe aanby_sector_exchange. - Ken de kolom
market_cap_mvanby_sector_exchangetoe aan een variabelebse_mcm. - Gebruik
.agg()om het gemiddelde, de mediaan en de standaarddeviatie voormarket_cap_mte berekenen, en roep daarna de methode rename aan met een dictionary-argument voor de keywordparametercolumnsom de resultaten respectievelijk op te slaan in'Average','Median'en'Standard Deviation', en ken dit toe aansummary. - Print het resultaat naar je console.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create market_cap_m
listings['market_cap_m'] = ____[____].div(1e6)
# Group listing by both Sector and Exchange
by_sector_exchange = ____.____(['Sector', 'Exchange'])
# Subset market_cap_m of by_sector_exchange
bse_mcm = ____[____]
# Calculate mean, median, and std in summary
summary = ____.____(['____', '____', '____']).rename(columns={'mean': ____, 'median': ____, 'std':____})
# Print the summary
print(summary)