Wilayah Peminjam menurut Tahun
Dalam latihan ini Anda akan membuat tabulasi data berdasarkan tahun dan variabel msa (kota vs. rural).
Latihan ini adalah bagian dari kursus
Pemrosesan Data yang Dapat Diskalakan di R
Petunjuk latihan
Semua paket yang diperlukan sudah dimuat di workspace Anda.
- Buat fungsi
make_table()yang membaca chunk sebagai matriks lalu membuat tabulasi berdasarkan wilayah peminjam (msa) dan tahun. - Gunakan
chunk.apply()untuk mengimpor data dari koneksi berkas yang telah kami sediakan untuk Anda. - Jalankan sisa kode untuk memvisualisasikan perubahan jumlah hipotek yang diterima menurut wilayah.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)
# Create a function to read chunks
make_table <- function(chunk) {
# Create a matrix
m <- ___(___, sep = ",", type = "integer")
colnames(m) <- mort_names
# Create the output table
___(___, c(___, ___))
}
# Import data using chunk.apply
msa_year_table <- ___
# Close connection
close(fc)
# Convert to a data frame
df_msa <- as.data.frame(msa_year_table)
# Rename columns
df_msa$MSA <- c("rural", "city")
# Gather on all columns except Year
df_msa_long <- pivot_longer(df_msa, -MSA, names_to = "Year", values_to = "Count")
# Plot
ggplot(df_msa_long, aes(x = Year, y = Count, group = MSA, color = MSA)) +
geom_line()