1. 学ぶ
  2. /
  3. コース
  4. /
  5. Python で始めるデータのインポート入門

Connected

演習

pandas を使ってフラットファイルを DataFrame に読み込む (2)

前の演習では、フラットファイルを pandas の DataFrame に読み込めました。さらに、メソッド .to_numpy() を使うと、対応する numpy 配列を簡単に取得できます。ここでは、digits.csv として提供されている MNIST データセットを使って実践します。

この演習で役立つ pd.read_csv() の主な引数は次のとおりです。

  • nrows は、ファイルから読み込む行数を指定します。例えば、nrows=10 とすれば最初の 10 行だけを読み込みます。
  • header は、列ラベルとして使う行番号を受け取り、データの開始位置を示します。ファイルにヘッダー行がない場合は header=None を指定すると、pandas が 0 から始まる整数の列ラベル(例: 0, 1, 2, …)を自動で割り当てます。

指示

100 XP
  • 関数 pd.read_csv() を使って、このファイルの「最初の 5 行」を DataFrame として読み込み、結果を data に代入します。引数 nrows と header を使用してください。このファイルにはヘッダー行がありません。
  • 得られた DataFrame data から numpy 配列を作成し、data_array に代入します。
  • print(type(data_array)) を実行して、data_array のデータ型を出力します。