1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで欠損データに対処する

Connected

演習

削除しますか?

欠損値を完全に削除する前に、削除の判断材料を考慮する必要があります。最もシンプルな判断材料は、欠損データの大きさです。欠損に影響するより複雑な理由については、ドメイン知識が必要になる場合もあります。この演習では、欠損の理由を見極め、適切な削除方法を実行します。

まず msno.matrix() と msno.heatmap() を使って、欠損の状況と、欠損を含む変数間の相関を可視化します。次に、欠損のパターンを判断します。最後に、欠損の種類に応じて削除を行います。

diabetes のDataFrameはすでに読み込まれています。

出力を見やすくするため、plt.show() の代わりに独自の display() 関数を使用しています。

指示1 / 4

undefined XP
    1
    2
    3
    4
  • diabetes の欠損マトリクスを可視化します。