MulaiMulai sekarang secara gratis

Wilayah Peminjam menurut Tahun

Dalam latihan ini Anda akan membuat tabulasi data berdasarkan tahun dan variabel msa (kota vs. rural).

Latihan ini adalah bagian dari kursus

Pemrosesan Data yang Dapat Diskalakan di R

Lihat Kursus

Petunjuk latihan

Semua paket yang diperlukan sudah dimuat di workspace Anda.

  • Buat fungsi make_table() yang membaca chunk sebagai matriks lalu membuat tabulasi berdasarkan wilayah peminjam (msa) dan tahun.
  • Gunakan chunk.apply() untuk mengimpor data dari koneksi berkas yang telah kami sediakan untuk Anda.
  • Jalankan sisa kode untuk memvisualisasikan perubahan jumlah hipotek yang diterima menurut wilayah.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)

# Create a function to read chunks
make_table <- function(chunk) {
    # Create a matrix
    m <- ___(___, sep = ",", type = "integer")
    colnames(m) <- mort_names
    # Create the output table
    ___(___, c(___, ___))
}

# Import data using chunk.apply
msa_year_table <- ___

# Close connection
close(fc)

# Convert to a data frame
df_msa <- as.data.frame(msa_year_table)

# Rename columns
df_msa$MSA <- c("rural", "city")

# Gather on all columns except Year
df_msa_long <- pivot_longer(df_msa, -MSA, names_to = "Year", values_to = "Count")

# Plot 
ggplot(df_msa_long, aes(x = Year, y = Count, group = MSA, color = MSA)) + 
    geom_line()
Edit dan Jalankan Kode