Kreditnehmer: ethnische Zugehörigkeit und Herkunft nach Jahr (II)
In dieser Übung nutzt du sowohl iotools als auch bigtabulate, um die ethnische Zugehörigkeit und Herkunft von Kreditnehmern nach Jahr zu tabellieren.
Diese Übung ist Teil des Kurses
Skalierbare Datenverarbeitung in R
Anleitung zur Übung
iotools und bigtabulate sind in deinem Workspace geladen.
- Erstelle eine Funktion
make_table(), die einen Chunk als Matrix einliest und ihn dann nach ethnischer Zugehörigkeit/Herkunft der Kreditnehmer und Jahr tabelliert. - Verwende
chunk.apply(), um die Daten aus der für dich erstellten Dateiverbindung zu importieren. - Konvertiere
race_year_tablein ein Data Frame.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)
# Create a function to read chunks
make_table <- function(chunk) {
# Create a matrix
m <- ___(chunk, sep = ",", type = "integer")
colnames(m) <- mort_names
# Create the output table
___(m, c("borrower_race", "year"))
}
# Import data using chunk.apply
race_year_table <- ___(fc, make_table)
# Close connection
close(fc)
# Cast it to a data frame
rydf <- ___(race_year_table)
# Create a new column Race with race/ethnicity
rydf$Race <- race_cat