1. 学ぶ
  2. /
  3. コース
  4. /
  5. データエンジニアリング入門

Connected

演習

破損データを取り除く

変換フェーズで繰り返し行うステップの1つに、不完全なデータのクリーンアップがあります。この演習では、次の形式のコースデータを確認します。

course_id title description programming_language
1 Some Course … r

この DataFrame を点検し、pandas の DataFrame メソッド .isnull().sum() を使って、欠損値がないことを確認します。programming_language 列には欠損があることが分かります。

そこで、.fillna() メソッドを使って欠損値を埋めるように、transform_fill_programming_language() 関数を完成させます。

指示

100 XP
  • course_data の欠損値の数を出力してください。
  • programming_language の欠損値は言語 "R" で埋めてください。
  • 今度は transformed に対して、列ごとの欠損値の数をもう一度出力してください。