1. Learn
  2. /
  3. Courses
  4. /
  5. Python으로 ETL과 ELT

Connected

Exercise

pandas DataFrame 필터링

소스 시스템에서 데이터를 추출했다면 이제 변환할 차례예요! 종종 소스 데이터에는 다운스트림 활용에 불필요한 정보가 포함되어 있어요. 이런 경우라면 데이터 파이프라인의 "transform" 단계에서 차원을 축소하는 것이 좋아요.

pandas는 pd로 임포트되어 있으며, 경로를 받아 DataFrame을 로드하는 extract() 함수를 사용할 수 있어요.

Instructions

100 XP
  • extract() 함수를 사용해 "sales_data.parquet" 경로에 저장된 DataFrame을 로드하세요.
  • transform() 함수를 업데이트하여 "Quantity Ordered"가 1보다 큰 모든 행과 모든 열을 반환하도록 하세요.
  • clean_data DataFrame을 추가로 필터링해 "Order Date", "Quantity Ordered", "Purchase Address" 열만 포함하세요.
  • 필터링된 DataFrame을 반환하세요.