1. Learn
  2. /
  3. Cursuri
  4. /
  5. Importul și gestionarea datelor financiare în Python

Connected

exercițiu

Automatizează încărcarea și combinarea datelor din mai multe foi Excel

Acum ești pregătit să automatizezi procesul de import al informațiilor despre listări din toate cele trei burse din fișierul Excel listings.xlsx, folosind o buclă for. Iată ce vei face:

  1. Recuperează numele foilor dintr-un obiect pd.ExcelFile() folosind atributul sheet_names.
  2. Creează o listă goală.
  3. Scrie o buclă for care iterează prin aceste nume de foi pentru a citi datele din foaia corespunzătoare din fișierul Excel într-o variabilă. Adaugă o coloană de referință, dacă dorești. Adaugă conținutul acestei variabile la listă la fiecare iterație.
  4. Concatenează DataFrame-urile din listă.

Ca întotdeauna, consultă exercițiile anterioare din acest capitol sau documentația pandas dacă ai nevoie de ajutor. pandas a fost importat ca pd.

Instrucțiuni

100 XP
  • Creează obiectul pd.ExcelFile() folosind fișierul listings.xlsx și atribuie-l variabilei xls.
  • Recuperează numele foilor din atributul .sheet_names al obiectului xls și atribuie-le variabilei exchanges.
  • Creează o listă goală și atribuie-o variabilei listings.
  • Iterează peste exchanges folosind o buclă for cu exchange ca variabilă iterator. La fiecare iterație:
    • Folosește pd.read_excel() cu xls ca sursă de date, exchange ca argument sheet_name și 'n/a' ca na_values pentru a gestiona valorile lipsă. Atribuie rezultatul variabilei listing.
    • Creează o coloană nouă în listing numită 'Exchange' cu valoarea exchange (variabila iterator).
    • Adaugă DataFrame-ul listing rezultat la listings.
  • Folosește pd.concat() pentru a concatena conținutul din listings și atribuie rezultatul variabilei listing_data.
  • Inspectează conținutul lui listing_data folosind .info().