1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で学ぶ ETL と ELT

Connected

演習

pandasで欠損値を埋める

データパイプラインを構築していると、欠損データに出会うのは避けられません。状況によっては、これらのレコードをデータセットから削除することもありますが、別の場合には、欠損している情報を推定して補完する必要があります。この演習では、pandas を使って欠損したテストスコアを補完する練習をします。

ファイル "testing_scores.json" のデータは DataFrame に読み込まれ、変数 raw_testing_scores に保存されています。さらに、pandas は pd として読み込まれています。

指示1 / 3

undefined XP
    1
    2
    3
  • raw_testing_scores DataFrame の先頭を表示し、NaN の値を確認します。