Ein big.matrix-Objekt einlesen
In dieser Übung erstellst du dein erstes dateigestütztes big.matrix-Objekt mit der Funktion read.big.matrix(). Die Funktion ähnelt read.table(), benötigt aber zusätzlich den gewünschten numerischen Datentyp ("char", "short", "integer", "double"), den Namen der Datei, die die Matrixdaten speichert (Backing-Datei), und den Namen der Datei, die Informationen über die Matrix enthält (Descriptor-Datei). Das Ergebnis sind eine Datei auf der Festplatte mit den eingelesenen Werten sowie eine Descriptor-Datei mit Zusatzinformationen (z. B. Anzahl der Spalten und Zeilen) über das resultierende big.matrix-Objekt.
Diese Übung ist Teil des Kurses
Skalierbare Datenverarbeitung in R
Anleitung zur Übung
- Lade das Paket
bigmemory. - Verwende die Funktion
read.big.matrix(), um die Datei"mortgage-sample.csv"einzulesen. Sie enthält einen Header und besteht aus Integer-Werten. Zusätzlich:- Erstelle eine Backing-Datei namens
"mortgage-sample.bin", und - eine Descriptor-Datei namens
"mortgage-sample.desc".
- Erstelle eine Backing-Datei namens
- Ermittle die Dimensionen von
xmit der Funktiondim().
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load the bigmemory package
___
# Create the big.matrix object: x
x <- ___(___, header = ___,
type = ___,
backingfile = ___,
descriptorfile = ___)
# Find the dimensions of x
___