1. 학습
  2. /
  3. 강의
  4. /
  5. Python で学ぶ Machine Learning のための特徴量エンジニアリング

Connected

연습 문제

自分のデータはどれくらいスパース?

ほとんどのデータセットには欠損値が含まれており、NaN(Not a Number)で表されることが多いです。Pandas を使っている場合、各列にいくつの欠損値があるかを簡単に確認できます。

アンケートに回答した開発者のうち、年齢(so_survey_df の Age 列)と性別(so_survey_df の Gender 列)を入力した人が何人いるかを調べてみましょう。

지침 1/2

undefined XP
    1
    2
  • DataFrame をサブセットし、'Age' と 'Gender' 列のみを含めます。
  • 両方の列で非欠損値の件数を表示します。