1. Nauka
  2. /
  3. Kursy
  4. /
  5. Importowanie i zarządzanie danymi finansowymi w Pythonie

Connected

ćwiczenie

Automatyzacja wczytywania i łączenia danych z wielu arkuszy Excela

Czas zautomatyzować import danych z wszystkich trzech giełd zapisanych w pliku Excel listings.xlsx – wykorzystasz do tego pętlę for. Oto plan działania:

  1. Pobierz nazwy arkuszy obiektu pd.ExcelFile() za pomocą atrybutu sheet_names.
  2. Utwórz pustą listę.
  3. Napisz pętlę for, która przejdzie przez te nazwy arkuszy i wczyta dane z odpowiedniego arkusza do zmiennej. W razie potrzeby dodaj kolumnę referencyjną. W każdej iteracji dołącz zawartość tej zmiennej do listy.
  4. Połącz wszystkie DataFrame'y z listy w jeden.

W razie wątpliwości zajrzyj do poprzednich ćwiczeń z tego rozdziału lub do dokumentacji pandas. Biblioteka pandas jest już zaimportowana jako pd.

Instrukcje

100 XP
  • Utwórz obiekt pd.ExcelFile() na podstawie pliku listings.xlsx i przypisz go do zmiennej xls.
  • Pobierz nazwy arkuszy z atrybutu .sheet_names obiektu xls i przypisz je do zmiennej exchanges.
  • Utwórz pustą listę i przypisz ją do zmiennej listings.
  • Iteruj po exchanges za pomocą pętli for, używając exchange jako zmiennej iteratora. W każdej iteracji:
    • Użyj pd.read_excel(), podając xls jako źródło danych, exchange jako argument sheet_name oraz 'n/a' jako na_values, aby obsłużyć brakujące wartości. Wynik przypisz do zmiennej listing.
    • Dodaj do listing nową kolumnę o nazwie 'Exchange' z wartością exchange (zmienna iteratora).
    • Dołącz DataFrame listing do listy listings.
  • Użyj pd.concat(), aby połączyć zawartość listy listings, i przypisz wynik do zmiennej listing_data.
  • Sprawdź zawartość listing_data za pomocą .info().