CommencerCommencer gratuitement

Origine ethnique et race des emprunteurs par année (II)

Dans cet exercice, vous allez utiliser iotools et bigtabulate pour établir un tableau de la race et de l’origine ethnique des emprunteurs par année.

Cet exercice fait partie du cours

Traitement de données à grande échelle en R

Afficher le cours

Instructions

iotools et bigtabulate sont chargés dans votre espace de travail.

  • Créez une fonction make_table() qui lit un bloc en tant que matrice puis l’agrège par race de l’emprunteur et par année.
  • Utilisez chunk.apply() pour importer les données depuis la connexion fichier que nous avons créée pour vous.
  • Convertissez race_year_table en data frame.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Open a connection to the file and skip the header
fc <- file("mortgage-sample.csv", "rb")
readLines(fc, n = 1)

# Create a function to read chunks
make_table <- function(chunk) {
    # Create a matrix
    m <- ___(chunk, sep = ",", type = "integer")
    colnames(m) <- mort_names
    # Create the output table
    ___(m, c("borrower_race", "year"))
}

# Import data using chunk.apply
race_year_table <- ___(fc, make_table)

# Close connection
close(fc)

# Cast it to a data frame
rydf <- ___(race_year_table)

# Create a new column Race with race/ethnicity
rydf$Race <- race_cat
Modifier et exécuter le code