Ras en etniciteit van leners per jaar (II)
In deze oefening gebruik je zowel iotools als bigtabulate om het ras en de etniciteit van leners per jaar te tabeleren.
Deze oefening maakt deel uit van de cursus
Schaalbare gegevensverwerking in R
Oefeninstructies
iotools en bigtabulate zijn geladen in je werkruimte.
- Maak een functie
make_table()die een chunk als matrix inleest en deze vervolgens per ras van de lener en jaar tabelleert. - Gebruik
chunk.apply()om de gegevens te importeren vanuit de bestandsverbinding die we voor je hebben aangemaakt. - Converteer
race_year_tablenaar een data frame.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)
# Create a function to read chunks
make_table <- function(chunk) {
# Create a matrix
m <- ___(chunk, sep = ",", type = "integer")
colnames(m) <- mort_names
# Create the output table
___(m, c("borrower_race", "year"))
}
# Import data using chunk.apply
race_year_table <- ___(fc, make_table)
# Close connection
close(fc)
# Cast it to a data frame
rydf <- ___(race_year_table)
# Create a new column Race with race/ethnicity
rydf$Race <- race_cat