Alle zusammenfassenden Statistiken nach Sektor

Du kannst die verschiedenen zusammenfassenden Statistiken, die du im letzten Kapitel kennengelernt hast, auf ein groupby-Objekt anwenden, um Ergebnisse pro Kategorie zu erhalten. Dazu gehört auch die Funktion .describe(), die dir mehrere Kennzahlen auf einmal liefert!

Hier übst du das mit den NASDAQ-Listings. pandas wurde als pd importiert, und die Daten der NASDAQ-Börsenlistings stehen dir in deinem Arbeitsbereich im DataFrame nasdaq zur Verfügung.

Diese Übung ist Teil des Kurses

<Kurs>Importing and Managing Financial Data in Python</Kurs>

Kurs ansehen

Übungsanweisungen

Untersuche die nasdaq-Daten mit .info().
Erstelle eine neue Spalte market_cap_m, die die Marktkapitalisierung in Millionen USD enthält. Lösche in der nächsten Zeile die Spalte 'Market Capitalization'.
Gruppiere deine nasdaq-Daten nach 'Sector' und weise das Ergebnis nasdaq_by_sector zu.
Rufe die Methode .describe() auf nasdaq_by_sector auf, weise sie summary zu und gib das Ergebnis aus.
Das funktioniert, aber summary ist im Long-Format und verwendet einen pd.MultiIndex(), den du zuvor gesehen hast. Wandle summary mit .unstack() ins Wide-Format um.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Inspect NASDAQ data
nasdaq.____()

# Create market_cap_m
nasdaq['market_cap_m'] = ____[____].div(1e6)

# Drop the Market Capitalization column
nasdaq.drop('Market Capitalization', axis=1, inplace=True)

# Group nasdaq by Sector
nasdaq_by_sector = ____.____(____)

# Create summary statistics by sector
summary = ____.____()

# Print the summary
print(summary)

# Unstack 
summary = ____.____()

# Print the summary again
print(summary)

Code bearbeiten und ausführen