1. Lernen
  2. /
  3. Kurse
  4. /
  5. Python で学ぶ ETL と ELT

Connected

Übung

assert を使ってデータパイプラインを検証する

データパイプラインのユニットテストを作成するには、assert キーワードと isinstance() 関数に慣れておくことが重要です。この演習では、これら2つのツールを使ってデータパイプラインの構成要素を検証する練習を行います。

関数 extract() と transform() が用意されており、pandas は pd としてインポート済みです。extract() と transform() はどちらも DataFrame を返します。がんばってください!

Anweisungen 1/4

undefined XP
  • 1
    • clean_tax_data DataFrame に5列あることをアサートしてください。
  • 2
    • clean_tax_data 変数に格納されたオブジェクトが pd.DataFrame のインスタンスであることを検証してください。
  • 3
    • clean_tax_data 変数に格納された値が pd.DataFrame のインスタンスであることをアサートしてください。
  • 4
    • clean_tax_data の型が str であるとアサートして、どのような例外が発生するかを確認してみましょう。