1. Nauka
  2. /
  3. Kursy
  4. /
  5. Importowanie i zarządzanie danymi finansowymi w Pythonie

Connected

ćwiczenie

Mediana kapitalizacji rynkowej według sektora

Dane zagregowane to dane połączone z kilku pomiarów. Jak widziałeś w filmie, funkcja .groupby() jest bardzo przydatna do agregowania danych według określonej kategorii.

Wcześniej zaobserwowałeś, że dane o kapitalizacji rynkowej zawierają duże wartości odstające. Aby uzyskać bardziej rzetelne podsumowanie wartości rynkowej spółek w każdym sektorze, obliczysz medianę kapitalizacji rynkowej według sektora. Biblioteki pandas jako pd oraz matplotlib.pyplot jako plt są już zaimportowane, a dane o notowaniach giełdy NYSE są dostępne w przestrzeni roboczej jako DataFrame nyse.

Instrukcje

100 XP
  • Zbadaj nyse za pomocą .info().
  • Korzystając z rozgłaszania (broadcasting) i .div(), utwórz nową kolumnę market_cap_m zawierającą kapitalizację rynkową w milionach USD.
  • Usuń kolumnę 'Market Capitalization' za pomocą .drop().
  • Zastosuj metodę .groupby() do nyse, grupując dane według kolumny 'Sector'.
  • Oblicz medianę kolumny market_cap_m i zapisz wynik jako median_mcap_by_sector.
  • Wyświetl wynik jako poziomy wykres słupkowy z tytułem 'NYSE - Median Market Capitalization'. Użyj plt.xlabel() z wartością 'USD mn', aby dodać etykietę osi.
  • Pokaż wynik.