1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Python으로 금융 데이터 가져오기와 관리

Connected

Bài tập

여러 Excel 워크시트에서 데이터를 자동으로 불러오고 결합하기

이제 for 루프를 사용해 Excel 파일 listings.xlsx에 있는 세 거래소의 상장 정보 가져오기를 자동화할 준비가 되었습니다. 다음과 같이 진행해 볼게요:

  1. pd.ExcelFile() 객체의 sheet_names 속성을 사용해 시트 이름을 가져옵니다.
  2. 빈 리스트를 만듭니다.
  3. 이 시트 이름들을 순회하는 for 루프를 작성해, Excel 파일에서 해당 시트 이름의 데이터를 변수로 읽어들입니다. 필요하다면 참조용 열을 추가하세요. 각 반복에서 이 변수의 내용을 리스트에 추가합니다.
  4. 리스트에 담긴 DataFrame들을 연결(concatenate)합니다.

필요하면 이 장의 이전 연습 문제나 pandas 문서를 참고하세요. pandas는 pd로 임포트되어 있습니다.

Hướng dẫn

100 XP
  • 파일 listings.xlsx로 pd.ExcelFile() 객체를 생성하고 변수 xls에 할당하세요.
  • xls의 .sheet_names 속성에서 시트 이름을 가져와 exchanges에 할당하세요.
  • 빈 리스트를 만들어 변수 listings에 할당하세요.
  • for 루프에서 반복자 변수로 exchange를 사용해 exchanges를 순회하세요. 각 반복에서:
    • 누락값 처리를 위해 데이터 소스로 xls, sheet_name 인수로 exchange, na_values로 'n/a'를 사용해 pd.read_excel()을 호출하세요. 결과를 listing에 할당하세요.
    • listing에 'Exchange'라는 새 열을 만들고 값으로 exchange(반복자 변수)를 설정하세요.
    • 만들어진 listing DataFrame을 listings에 추가(append)하세요.
  • pd.concat()으로 listings의 내용을 연결하여 listing_data에 할당하세요.
  • .info()를 사용해 listing_data의 내용을 확인하세요.