1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶデータクリーニング

Connected

연습 문제

投資家が欠損している

欠損データへの対応は、データサイエンスでもっとも一般的な作業のひとつです。欠損にはさまざまな種類があり、解決策にもいくつかのアプローチがあります。

新規・既存顧客の預かり資産額と投資額を含む banking DataFrame の新しいバージョンが届きました。ただし、inv_amount に欠損値がある行があります。

25歳未満の顧客の多くはまだ投資口座を持っていないことを知っており、これが欠損の原因になっている可能性を疑っています。pandas、missingno、matplotlib.pyplot パッケージはそれぞれ pd、msno、plt としてインポート済みです。banking DataFrame は環境に用意されています。

지침 1/4

undefined XP
    1
    2
    3
    4
  • banking DataFrame の列ごとの欠損数を出力します。
  • msno.matrix() 関数で banking の欠損マトリクスをプロットし、表示します。