1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandasで効率よくデータを取り込む

Connected

演習

一部の列だけをインポートする

Vermont の税データには、世帯構成、収入源、納税額を ZIP コードと所得グループごとに示す 147 列が含まれています。ほとんどの分析では、これらすべての列は必要ありません。この演習では、read_csv() の usecols 引数を使って、変数数を絞ったデータフレームを作成します。

地理や所得水準によって世帯構成に違いがあるかに注目しましょう。そのために、所得グループ、ZIP コード、申告ステータス(例:単身・既婚)、扶養家族に関する列が必要です。データでは変数名にコードが使われているため、必要な具体的な列名は指示に記載されています。

pandas はすでに pd としてインポート済みです。

指示

100 XP
  • 使用する列のリストを作成します:zipcode、agi_stub(所得グループ)、mars1(単身世帯数)、MARS2(既婚として申告した世帯数)、NUMDEP(扶養家族数)。
  • vt_tax_data_2016.csv から、選択した列のみを使ってデータフレームを作成します。