1. 학습
  2. /
  3. 강의
  4. /
  5. Rで学ぶスケーラブルなデータ処理

Connected

연습 문제

チャンクを data.frame として読み込む

前の例では、mstrsplit() を使って各チャンクを行列として処理関数に渡していました。各列で要素の型が同じという前提の、長方形データを読む場合はこれで問題ありません。そうでない場合は、データを data.frame として読み込みたくなることがあります。これは、チャンクを一度行列として読み込んでから data.frame に変換する方法もありますし、dstrsplit() 関数を使って直接読み込むこともできます。

지침

100 XP
  • 関数 make_msa_table() の中で、各チャンクをデータフレームとして読み込みます。
  • chunk.apply() を呼び出して、データをチャンク単位で読み込みます。
  • すべての行を合計して、各列の合計件数を取得します。