1. 学ぶ
  2. /
  3. コース
  4. /
  5. pandasで効率よくデータを取り込む

Connected

演習

スプレッドシートの一部を読み込む

人が読むことを想定したスプレッドシートには、複数の表が含まれることがよくあります。たとえば小規模ビジネスの在庫管理ブックでは、1つのシートに製品タイプごとの表が並んでいるかもしれません。表形式のデータにも、ここにある New Developer Survey のように、メタデータのヘッダー行が含まれることがあります。メタデータ自体は有用ですが、dataframe には含めたくありません。ここでは、read_excel() の skiprows キーワードを使って、必要なデータだけを取得します。また、将来の就業目標に関する列だけを取得するため、usecols に渡す文字列を作成し、AD 列と AW〜BA の範囲を指定します。

pandas は pd としてインポート済みです。

指示

100 XP
  • pandas が列 AD と 範囲 AW〜BA を読み込むように指定する単一の文字列 col_string を作成します。
  • fcc_survey_headers.xlsx' を読み込み、skiprows と usecols を設定して、先頭2行のメタデータをスキップし、col_string で指定した列のみを取得します。
  • 得られた dataframe で、選択された列名を確認します。