Mehrere Kennzahlen nach Sektor und Börse berechnen
Die Funktion .agg() ermöglicht es dir, deine Daten noch flexibler zu aggregieren. Übergibst du eine Liste mit Namen statistischer Methoden, werden mehrere Kennzahlen auf einmal berechnet. Mit der Methode rename kannst du neue Namen für die aggregierten Spalten vergeben. Sie nimmt ein Dictionary entgegen, in dem die Schlüssel die Namen der berechneten Metriken und die Werte die gewünschten neuen Spaltennamen sind.
In dieser Übung berechnest du den Mittelwert, Median und die Standardabweichung der Marktkapitalisierung in Millionen USD. pandas als pd und matplotlib.pyplot als plt sind bereits importiert, und das DataFrame listings mit der Referenzspalte 'Exchange' steht dir im Workspace zur Verfügung.
Diese Übung ist Teil des Kurses
Importing and Managing Financial Data in Python
Anleitung zur Übung
- Erstelle mit Broadcasting und
.div()eine neue Spalte'market_cap_m', die die Marktkapitalisierung in Millionen USD enthält. - Gruppiere deine Daten nach sowohl
'Sector'als auch'Exchange'und weise das Ergebnisby_sector_exchangezu. - Weise die Spalte
market_cap_mvonby_sector_exchangeder Variablenbse_mcmzu. - Verwende
.agg(), um fürmarket_cap_mMittelwert, Median und Standardabweichung zu berechnen, und rufe anschließend die Methoderenamemit einem Dictionary-Argument für den Schlüsselwortparametercolumnsauf. Speichere die Ergebnisse unter'Average','Median'und'Standard Deviation'und weise siesummaryzu. - Gib das Ergebnis in der Konsole aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create market_cap_m
listings['market_cap_m'] = ____[____].div(1e6)
# Group listing by both Sector and Exchange
by_sector_exchange = ____.____(['Sector', 'Exchange'])
# Subset market_cap_m of by_sector_exchange
bse_mcm = ____[____]
# Calculate mean, median, and std in summary
summary = ____.____(['____', '____', '____']).rename(columns={'mean': ____, 'median': ____, 'std':____})
# Print the summary
print(summary)