1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandasで効率よくデータを取り込む

Connected

演習

カスタム NA 値を設定する

データの探索とクレンジングの一部は、欠損値や NA を確認し、それらをどう扱うかを決めることです。欠損値を独自のデータ型として扱うと、この作業が簡単になります。pandas には NA を対象にした関数が用意されています。pandas は一部の値を自動的に欠損として扱いますが、na_values 引数で追加の NA 指標を渡すこともできます。ここでは、バーモント州の税データに含まれる不正な ZIP コードが NA としてコード化されるように設定します。

pandas は pd としてインポート済みです。

指示

100 XP
  • zipcode 列の 0 を NA と見なすように指定した辞書 null_values を作成してください。
  • na_values 引数にその辞書を渡して vt_tax_data_2016.csv を読み込み、不正な ZIP コードが欠損として処理されるようにしてください。