Aan de slagGa gratis aan de slag

Een big.matrix-object inlezen

In deze oefening maak je je eerste file-backed big.matrix-object met de functie read.big.matrix(). De functie lijkt op read.table(), maar heeft daarnaast extra informatie nodig: welk type numerieke waarden je wilt inlezen ("char", "short", "integer", "double"), de naam van het bestand dat de gegevens van de matrix zal bevatten (het backing-bestand), en de naam van het bestand dat informatie over de matrix bevat (het descriptorbestand). Het resultaat is een bestand op de schijf met de ingelezen waarden en een descriptorbestand met extra informatie (zoals het aantal kolommen en rijen) over het resulterende big.matrix-object.

Deze oefening maakt deel uit van de cursus

Schaalbare gegevensverwerking in R

Cursus bekijken

Oefeninstructies

  • Laad het bigmemory-pakket.
  • Gebruik de functie read.big.matrix() om het bestand "mortgage-sample.csv" in te lezen. Dit bestand bevat een header en bestaat uit gehele getallen. Daarnaast:
    • Maak een backing-bestand met de naam "mortgage-sample.bin", en
    • Een descriptorbestand met de naam "mortgage-sample.desc".
  • Bepaal de afmetingen van x met de functie dim().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load the bigmemory package
___

# Create the big.matrix object: x
x <- ___(___, header = ___, 
                     type = ___, 
                     backingfile = ___, 
                     descriptorfile = ___)
    
# Find the dimensions of x
___
Code bewerken en uitvoeren