De verhouding van leners naar ras/etniciteit vergelijken
In deze oefening vergelijk je de rassen- en etnische verhoudingen in de VS met het aandeel van het totale aantal leners per ras of etniciteit. Dit is een eerste check om te zien of elke groep leent in een tempo dat vergelijkbaar is met haar aandeel in de bevolking van de Verenigde Staten. De taak lijkt op de vorige oefening, maar dit keer gebruik je iotools om het te doen.
Deze oefening maakt deel uit van de cursus
Schaalbare gegevensverwerking in R
Oefeninstructies
- Maak een matrix van elk chunk van
"mortgage-sample.csv". - Tel de rijen op voor alle kolommen van
race_table_chunks.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create table of the borrower_race
race_table_chunks <- ___(
"mortgage-sample.csv", function(chunk) {
x <- ___(chunk, sep = ",", type = "integer")
colnames(x) <- mort_names
table(x[, "borrower_race"])
}, CH.MAX.SIZE = 1e5)
# Add up the columns
race_table <- ___(race_table_chunks)
# Find the proportion
borrower_proportion <- race_table[1:7] / sum(race_table[1:7])
# Create the matrix
matrix(c(pop_proportion, borrower_proportion), byrow = TRUE, nrow = 2,
dimnames = list(c("Population Proportion", "Borrower Proportion"), race_cat[1:7]))