1. Nauka
  2. /
  3. Kursy
  4. /
  5. Importowanie i zarządzanie danymi finansowymi w Pythonie

Connected

ćwiczenie

Oblicz wybrane statystyki według sektora i roku IPO

Funkcja pointplot() z biblioteki seaborn ułatwia porównywanie statystyk podsumowujących zmiennej numerycznej dla różnych poziomów zmiennych kategorycznych:

seaborn.pointplot(x=None, y=None, hue=None, data=None, ...)

W filmie widziałeś wizualizację kapitalizacji rynkowej (zmienna numeryczna) z podziałem na to, czy IPO (zmienna kategoryczna) miało miejsce przed (pierwszy poziom) czy po (drugi poziom) roku 2000.

W tym ćwiczeniu porównasz średnią kapitalizację rynkową dla każdego roku od 2000 dla giełd NYSE i NASDAQ, po wykluczeniu wartości odstających powyżej 95. percentyla. Biblioteki pandas jako pd i matplotlib.pyplot jako plt zostały już zaimportowane, a ramka danych listings z kolumną referencyjną 'Exchange' jest dostępna w twoim środowisku.

Instrukcje

100 XP
  • Zaimportuj seaborn jako sns.
  • Przefiltruj listings, aby uwzględniać tylko spółki z IPO po 2000 roku ze wszystkich giełd z wyjątkiem 'amex'.
  • Przekonwertuj dane w kolumnie 'IPO Year' na liczby całkowite.
  • Utwórz kolumnę market_cap_m, aby wyrazić kapitalizację rynkową w milionach USD.
  • Przefiltruj market_cap_m, wykluczając wartości powyżej 95. percentyla.
  • Utwórz wykres pointplot dla listings, używając kolumny 'IPO Year' dla x, 'market_cap_m' dla y i 'Exchange' dla hue. Wyświetl wynik, obracając etykiety osi xticks o 45 stopni.