Vergleich von Rasse/Ethnie der Kreditnehmenden und ihren Anteilen
In dieser Übung vergleichst du die Anteile der US-Bevölkerung nach Rasse und Ethnie mit dem Anteil der gesamten Kreditnehmenden nach Rasse bzw. Ethnie. So prüfst du zunächst, ob jede Gruppe in etwa in dem Umfang Kredite aufnimmt, der ihrer Bevölkerungsrepräsentation in den Vereinigten Staaten entspricht. Die Aufgabe ist der letzten Übung ähnlich, aber diesmal verwendest du iotools, um sie zu lösen.
Diese Übung ist Teil des Kurses
Skalierbare Datenverarbeitung in R
Anleitung zur Übung
- Erstelle aus jedem Chunk der Datei
"mortgage-sample.csv"eine Matrix. - Summiere die Zeilen über alle Spalten von
race_table_chunksauf.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create table of the borrower_race
race_table_chunks <- ___(
"mortgage-sample.csv", function(chunk) {
x <- ___(chunk, sep = ",", type = "integer")
colnames(x) <- mort_names
table(x[, "borrower_race"])
}, CH.MAX.SIZE = 1e5)
# Add up the columns
race_table <- ___(race_table_chunks)
# Find the proportion
borrower_proportion <- race_table[1:7] / sum(race_table[1:7])
# Create the matrix
matrix(c(pop_proportion, borrower_proportion), byrow = TRUE, nrow = 2,
dimnames = list(c("Population Proportion", "Borrower Proportion"), race_cat[1:7]))