LoslegenKostenlos loslegen

Chunks als Matrix einlesen

In dieser Übung schreibst du eine skalierbare table()-Funktion, die mit chunk.apply() die Anzahl städtischer und ländlicher Kreditnehmender im Mortgage-Datensatz zählt. Standardmäßig fasst chunk.apply() die verarbeiteten Daten mit der Funktion rbind() zusammen. Das bedeutet: Du kannst aus jedem Chunk eine Tabelle erzeugen und anschließend die Zeilen der resultierenden Matrix aufsummieren, um die Gesamtanzahlen für die Tabelle zu erhalten.

Wir haben bereits eine Dateiverbindung fc zur Datei "mortgage-sample.csv" erstellt und die erste Zeile eingelesen, um die Kopfzeile zu entfernen.

Diese Übung ist Teil des Kurses

Skalierbare Datenverarbeitung in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Define the function to apply to each chunk
make_table <- function(chunk) {
    # Read each chunk as a matrix
    x <- ___(chunk, type = "integer", sep = ",")
    # Create a table of the number of borrowers (column 3) for each chunk
    table(x[, 3])
}
Code bearbeiten und ausführen