1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで欠損データに対処する

Connected

연습 문제

MNAR を見抜く

前の演習では、欠損サマリーをもとに欠損の種類を見分けました。この演習では、その流れを引き継ぎ、Missing Not at Random(MNAR:無作為ではない欠損)を明確に特定していきます。

diabetes DataFrame の欠損サマリーは次のとおりです。

目標は、diabetes DataFrame を Serum_Insulin でソートし、Skin_Fold と Serum_Insulin の相関関係を把握することです。

出力を見やすくするために、plt.show() の代わりに独自の display() 関数を使用しています。

지침

100 XP
  • missingno パッケージを msno としてインポートします。
  • diabetes の Serum_Insulin 列の値をソートします。
  • msno.matrix() を使って Serum_Insulin の欠損サマリーを可視化します。