1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Pythonで欠損データに対処する

Connected

Exercise

インピュテーションを可視化する

インピュテーションを分析して最適な方法を選ぶには、たくさんの試行が必要です。インピュテーションの過程でデータにバイアスが入らないようにすることが重要です。 直前の2つの演習では、平均値、中央値、最頻値、定数で埋めるという4種類のインピュテーションを作成しました。

この演習では、先ほどインピュテーションした各DataFrameの散布図を作成します。そのために、タイトルをキーとしてDataFrameを値に持つ辞書を作成します。

diabetes_mean、diabetes_median、diabetes_mode、diabetes_constant の各DataFrameは読み込まれています。

Instrukcje

100 XP
  • 2行2列のプロットを作成して、サブプロットを4つ作成します。
  • それぞれのキーに対応するDataFrameを割り当てて、辞書 imputations を作成します。
  • axes と imputations をループし、imputations 内の各DataFrameをプロットします。
  • 色は nullity に設定し、各サブプロットのタイトルは対応するインピュテーション名に設定します。