Membaca potongan data sebagai matriks
Dalam latihan ini, Anda akan menulis fungsi table() yang skalabel untuk menghitung jumlah peminjam perkotaan dan pedesaan dalam himpunan data hipotek menggunakan chunk.apply(). Secara bawaan, chunk.apply() menggabungkan data yang diproses menggunakan fungsi rbind(). Artinya, Anda dapat membuat tabel dari setiap potongan data, lalu menjumlahkan baris-baris dari matriks yang dihasilkan untuk mendapatkan total hitungan untuk tabel tersebut.
Kami telah membuat koneksi berkas fc ke berkas "mortgage-sample.csv" dan membaca baris pertama untuk menghilangkan header.
Latihan ini adalah bagian dari kursus
Pemrosesan Data yang Dapat Diskalakan di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define the function to apply to each chunk
make_table <- function(chunk) {
# Read each chunk as a matrix
x <- ___(chunk, type = "integer", sep = ",")
# Create a table of the number of borrowers (column 3) for each chunk
table(x[, 3])
}