1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで欠損データに対処する

Connected

演習

欠損の種類を当てよう

欠損の種類を分析すると、欠損データへの最適な対処法を判断しやすくなります。Pima Indians の糖尿病データセットは、欠損が多いことでよく知られています。Pima Indians は糖尿病のリスクが高いとされる先住民族のコミュニティで、このデータセットには彼らに対して実施された複数の検査値が含まれます。

動画レッスンでは、欠損パターンの3種類を学びました。この演習では、まず欠損のサマリーを可視化し、そのうえで DataFrame に含まれる欠損の種類を特定します。

DataFrame はすでに diabetes として読み込まれています。

出力を見やすくするため、plt.show() の代わりに独自の display() 関数を使用しています。

指示1 / 2

undefined XP
    1
    2
  • missingno パッケージを msno としてインポートし、diabetes の欠損サマリーをプロットしてください。