1. Learn
  2. /
  3. Courses
  4. /
  5. PySparkで学ぶ特徴量エンジニアリング

Connected

Exercise

データ型の検証

データの時代には、これまでになく多くの属性にアクセスできます。これらを扱うために多くの自動化を構築しますが、最低限、それぞれのデータ型が正しいことが前提です。この演習では、属性とそのデータ型のディクショナリが正しいかどうかを検証します。このディクショナリは validation_dict という変数に格納され、ワークスペースで利用できます。

Instructions

100 XP
  • df の dtypes を使って、属性名とデータ型のタプルからなるリスト actual_dtypes_list を作成します。
  • actual_dtypes_list を反復し、列名が期待するデータ型のディクショナリ validation_dict に存在するかを確認します。
  • ディクショナリに存在するキーについてはデータ型を照合し、一致したものを出力します。