Alle zusammenfassenden Statistiken nach Sektor
Du kannst die verschiedenen zusammenfassenden Statistiken, die du im letzten Kapitel kennengelernt hast, auf ein groupby-Objekt anwenden, um Ergebnisse pro Kategorie zu erhalten. Dazu gehört auch die Funktion .describe(), die dir mehrere Kennzahlen auf einmal liefert!
Hier übst du das mit den NASDAQ-Listings. pandas wurde als pd importiert, und die Daten der NASDAQ-Börsenlistings stehen dir in deinem Arbeitsbereich im DataFrame nasdaq zur Verfügung.
Diese Übung ist Teil des Kurses
Importing and Managing Financial Data in Python
Anleitung zur Übung
- Untersuche die
nasdaq-Daten mit.info(). - Erstelle eine neue Spalte
market_cap_m, die die Marktkapitalisierung in Millionen USD enthält. Lösche in der nächsten Zeile die Spalte'Market Capitalization'. - Gruppiere deine
nasdaq-Daten nach'Sector'und weise das Ergebnisnasdaq_by_sectorzu. - Rufe die Methode
.describe()aufnasdaq_by_sectorauf, weise siesummaryzu und gib das Ergebnis aus. - Das funktioniert, aber
summaryist im Long-Format und verwendet einenpd.MultiIndex(), den du zuvor gesehen hast. Wandlesummarymit.unstack()ins Wide-Format um.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Inspect NASDAQ data
nasdaq.____()
# Create market_cap_m
nasdaq['market_cap_m'] = ____[____].div(1e6)
# Drop the Market Capitalization column
nasdaq.drop('Market Capitalization', axis=1, inplace=True)
# Group nasdaq by Sector
nasdaq_by_sector = ____.____(____)
# Create summary statistics by sector
summary = ____.____()
# Print the summary
print(summary)
# Unstack
summary = ____.____()
# Print the summary again
print(summary)