MulaiMulai sekarang secara gratis

Membaca potongan data sebagai matriks

Dalam latihan ini, Anda akan menulis fungsi table() yang skalabel untuk menghitung jumlah peminjam perkotaan dan pedesaan dalam himpunan data hipotek menggunakan chunk.apply(). Secara bawaan, chunk.apply() menggabungkan data yang diproses menggunakan fungsi rbind(). Artinya, Anda dapat membuat tabel dari setiap potongan data, lalu menjumlahkan baris-baris dari matriks yang dihasilkan untuk mendapatkan total hitungan untuk tabel tersebut.

Kami telah membuat koneksi berkas fc ke berkas "mortgage-sample.csv" dan membaca baris pertama untuk menghilangkan header.

Latihan ini adalah bagian dari kursus

Pemrosesan Data yang Dapat Diskalakan di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Define the function to apply to each chunk
make_table <- function(chunk) {
    # Read each chunk as a matrix
    x <- ___(chunk, type = "integer", sep = ",")
    # Create a table of the number of borrowers (column 3) for each chunk
    table(x[, 3])
}
Edit dan Jalankan Kode