1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandasで効率的にコードを書く

Connected

演習

欠損値の特定

欠損値補完に入る前の最初のステップは、データに欠損があるか、ある場合はどのグループから生じているかを特定することです。

レッスンで扱ったのと同じ restaurant_data では、従業員が誤って 65 卓分のチップの記録を消してしまいました。喫煙者がいるテーブルと、非喫煙者のみのテーブルのどちらから、どれだけ多くの欠損が発生したのかを知りたいとします。

あなたのタスクは、smoker 変数で両方のデータセットをグループ化し、存在する値の件数を数えてから、その差を計算することです。

ここではレッスンで学んだ概念を練習するためにチップを補完しています。倫理的な観点から、実務で金銭データを補完することは不正と見なされる可能性があるため、行うべきではありません。

指示

100 XP
  • 喫煙状況でデータをグループ化します。
  • 各グループの非欠損値の件数を計算します。
  • 各グループの欠損値の件数を出力します。