1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 ETL과 ELT

Connected

연습 문제

assert로 데이터 파이프라인 검증하기

데이터 파이프라인용 단위 테스트를 만들려면 assert 키워드와 isinstance() 함수에 익숙해지는 것이 중요합니다. 이번 연습에서는 이 두 도구를 사용해 데이터 파이프라인의 구성 요소를 검증해 보겠습니다.

pandas는 pd로 임포트되어 있으며, extract()와 transform() 함수가 제공됩니다. 두 함수 모두 DataFrame을 반환합니다. 화이팅이에요!

지침 1/4

undefined XP
  • 1
    • clean_tax_data DataFrame의 열이 다섯 개인지 assert로 확인하세요.
  • 2
    • clean_tax_data 변수에 저장된 객체가 pd.DataFrame의 인스턴스인지 검증하세요.
  • 3
    • clean_tax_data 변수에 저장된 값이 pd.DataFrame의 인스턴스인지 assert로 확인하세요.
  • 4
    • clean_tax_data의 타입이 str이라고 가정해 assert를 작성하고, 발생하는 예외를 확인해 보세요.