Een big.matrix-object inlezen
In deze oefening maak je je eerste file-backed big.matrix-object met de functie read.big.matrix(). De functie lijkt op read.table(), maar heeft daarnaast extra informatie nodig: welk type numerieke waarden je wilt inlezen ("char", "short", "integer", "double"), de naam van het bestand dat de gegevens van de matrix zal bevatten (het backing-bestand), en de naam van het bestand dat informatie over de matrix bevat (het descriptorbestand). Het resultaat is een bestand op de schijf met de ingelezen waarden en een descriptorbestand met extra informatie (zoals het aantal kolommen en rijen) over het resulterende big.matrix-object.
Deze oefening maakt deel uit van de cursus
Schaalbare gegevensverwerking in R
Oefeninstructies
- Laad het
bigmemory-pakket. - Gebruik de functie
read.big.matrix()om het bestand"mortgage-sample.csv"in te lezen. Dit bestand bevat een header en bestaat uit gehele getallen. Daarnaast:- Maak een backing-bestand met de naam
"mortgage-sample.bin", en - Een descriptorbestand met de naam
"mortgage-sample.desc".
- Maak een backing-bestand met de naam
- Bepaal de afmetingen van
xmet de functiedim().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the bigmemory package
___
# Create the big.matrix object: x
x <- ___(___, header = ___,
type = ___,
backingfile = ___,
descriptorfile = ___)
# Find the dimensions of x
___