LoslegenKostenlos loslegen

Ein big.matrix-Objekt einlesen

In dieser Übung erstellst du dein erstes dateigestütztes big.matrix-Objekt mit der Funktion read.big.matrix(). Die Funktion ähnelt read.table(), benötigt aber zusätzlich den gewünschten numerischen Datentyp ("char", "short", "integer", "double"), den Namen der Datei, die die Matrixdaten speichert (Backing-Datei), und den Namen der Datei, die Informationen über die Matrix enthält (Descriptor-Datei). Das Ergebnis sind eine Datei auf der Festplatte mit den eingelesenen Werten sowie eine Descriptor-Datei mit Zusatzinformationen (z. B. Anzahl der Spalten und Zeilen) über das resultierende big.matrix-Objekt.

Diese Übung ist Teil des Kurses

Skalierbare Datenverarbeitung in R

Kurs anzeigen

Anleitung zur Übung

  • Lade das Paket bigmemory.
  • Verwende die Funktion read.big.matrix(), um die Datei "mortgage-sample.csv" einzulesen. Sie enthält einen Header und besteht aus Integer-Werten. Zusätzlich:
    • Erstelle eine Backing-Datei namens "mortgage-sample.bin", und
    • eine Descriptor-Datei namens "mortgage-sample.desc".
  • Ermittle die Dimensionen von x mit der Funktion dim().

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load the bigmemory package
___

# Create the big.matrix object: x
x <- ___(___, header = ___, 
                     type = ___, 
                     backingfile = ___, 
                     descriptorfile = ___)
    
# Find the dimensions of x
___
Code bearbeiten und ausführen