1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandasで効率よくデータを取り込む

Connected

演習

データ型を指定する

フラットファイルを読み込むとき、pandas は各列に最適なデータ型を推定します。ですが、量ではなくグループや属性を表す数値などでは、推定が外れることがあります。

vt_tax_data_2016.csv のデータディクショナリを見ると、そのような列が2つあります。agi_stub 列は所得カテゴリに対応する番号で、zipcode は5桁の値ですが、これは文字列であるべきです。整数として扱うと、意味のある先頭の 0 が失われてしまいます。ここでは dtype 引数で正しいデータ型を指定しましょう。

pandas は pd としてインポート済みです。

指示1 / 2

undefined XP
    1
    2

引数なしで vt_tax_data_2016.csv を読み込み、データフレームの dtypes 属性を表示します。zipcode と agi_stub のデータ型に注目してください。