1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで欠損データに対処する

Connected

演習

欠損値を検出する

データセットには、欠損値を表す隠れたダミー値(例:'NA'、'.' など)が含まれていることがよくあります。この演習では、大学生のさまざまな情報を含む college データセットを扱います。あなたのタスクは、データセットを分析して欠損値を特定することです。

これを行うには、pandas の .info() メソッドや、.unique() メソッドと組み合わせた numpy の sort() 関数を使い、欠損データを表すダミー値をはっきり区別します。

college.csv はすでに読み込まれています。numpy と pandas もそれぞれ np と pd としてインポート済みです。

指示1 / 4

undefined XP
    1
    2
    3
    4
  • データセットの CSV を pandas の DataFrame に読み込みます。